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本 书 首 先 介绍 了 自主 移动 机 器 人 行为 建 模 与 控制 的 研究 意义 和 所 涉及 的 相关 
研究 ， 并 阐述 了 智能 体 、 多 智能 体 、 约 束 规 划 等 理论 基础 ， 在 简单 描述 一 些 相关 
理论 和 技术 的 基础 上 ， 提出 了 两 种 方法 ,分别 是 命题 交互 式 协 作 智能 体 语言 和 通 
用 交互 式 协 作 智 能 体 语言 。 详 细 描 述 了 ALICA (交互 式 协作 智能 体 语言 ) 的 语 
法 、 语 义 、 冲 突 检测 与 消解 、 软 件 架 构 、 约 束 问题 求解 等 内 容 。 最 后 ， 通 过 三 种 
场景 ， 即 机 器 人 足球 、 探 索 和 搜救 来 评估 验证 所 提 方 法 的 有 效 性 。 

本 书 是 涉及 多 机 器 人 协调 控制 方面 的 专著 ， 机 器 人 研究 领域 的 成 果 很 多 ， 相 
关 的 理论 与 方法 也 很 多 ， 本 书 的 创新 点 在 于 提出 一 种 交互 式 协作 智能 体 语 言 
ALICA 来 解决 在 动态 环境 下 ， 机 器 人 实时 反应 并 在 通信 不 可 靠 条 件 下 进行 冲突 
检测 与 消解 ， 通 过 约束 满足 与 约束 规划 等 理论 来 实现 多 机 器 人 之 间 的 协调 控制 。 
这 对 于 从 事 该 领域 工作 的 工程 人 员 和 高 年 级 学 生 有 着 重要 的 参考 作用 。 

作者 Hendrik Skubch 曾 是 卡 塞 尔 大 学 的 助理 研究 员 ， 现 在 日 本 Square Enix 
公司 工作 ， 长 期 从 事 多 机 器 人 协调 控制 方面 的 研究 ， 出 版 过 多 部 相关 著作 。 

本 书 主要 由 连 晓 峰 翻译 、 审 校 、 整 理 ， 并 对 原 书 中 的 错误 进行 了 注释 ， 王 佩 荣 、 
潘 媛 、 金 成 学 、 李 东 红 、 贾 琦 、 张 子 康 、 王 字 龙 、 郭 柯 、 王 伟 和 张 云 等 人 参与 了 
部 分 内 容 的 翻译 。 

本 书 可 作为 多 机 器 人 协调 控制 、 人 工 智能 和 计算 机 科学 领域 的 研究 人 员 的 参 
考 书 ， 也 可 作为 高 等 院 校 相关 专业 研究 生 以 及 教师 的 参考 用 书 。 

限于 译 者 的 经 验 和 水 平 ， 书 中 难免 存在 缺点 和 错误 ， 冤 请 广大 读者 批评 
指正 。 
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随 着 研究 的 不 断 深入 与 机 器 人 能 力 的 不 断 提 升 ， 机 器 人 系统 也 在 越 来 越 多 的 
情况 下 具有 切实 可 行 的 解决 方案 。 这 些 成 果 尤 其 应 用 在 多 机 器 人 系统 中 ， 将 单机 
器 人 的 能 力 与 功能 相 结合 。 未 来 自主 移动 机 器 人 的 和 鲁 棒 性 、 效 率 以 及 自 适 应 性 等 
关键 特性 都 在 复杂 性 和 动态 环境 下 得 到 充分 应 用 。 因 此 ， 不 同 建 模 和 推理 模式 所 
引发 的 问题 都 可 通过 预期 行为 的 描述 来 组 合 实现 ， 并 达到 上 述 特性 。 本 书 提 出 了 
一 种 实现 自主 移动 机 器 人 团队 行为 的 建 模 与 执行 的 综合 解决 方案 。 所 提出 的 框架 
ALICA (交互 式 协作 智能 体 语 言 ) 与 建 模 技 术 相 结合 ， 以 一 种 综合 方式 推导 出 不 
同 模式 。 利 用 有 限 状 态 机 的 层次 结构 来 构建 机 器 人 团队 的 行为 ， 由 此 可 表示 其 时 
间 关系 和 因果 关系 。 利 用 效用 函数 来 衡量 各 自 的 不 同 选 择 ， 并 对 不 同 智能 体 分 配 
不 同 任务 。 最 后 ， 将 约束 满足 和 优化 问题 相 集成 ， 可 用 于 以 一 种 简洁 且 具 有 良好 
理论 基础 的 方式 来 指定 复杂 的 协作 行为 。 该 系统 是 针对 要 求 机 器 人 必须 快速 反应 
的 高 度 动态 环境 ， 通 信 不 可 靠 且 单个 机 器 人 随时 可 能 损坏 的 环境 。 在 该 环境 下 ， 
要 求 智 能 体 在 面临 不 断 变化 的 情况 下 必须 及 时 反应 ， 而 不 是 采用 预先 设 定 的 协 
议 。 由 此 ，ALICA 智能 体 可 局 部 决策 并 在 建立 通信 之 前 相应 动作 。 由 不 一 致 的 
决策 和 信任 所 产生 的 冲突 可 以 可 靠 地 检测 和 解决 ， 这 是 由 于 ALICA 完全 分 布 式 
工作 ， 不 会 出 现 单个 故障 。 

从 建 模 角度 来 看 ，ALICA 作为 一 种 现代 编程 语言 可 对 机 器 人 团队 进行 全 局 
建 模 。 通 过 层次 结构 和 程序 组 件 的 抽象 可 提高 主题 透明 性 和 可 重用 性 的 复杂 度 。 
状态 机 、 效 用 函数 和 非 线性 连续 约束 满足 和 优化 问题 相 结合 为 描述 机 器 人 团队 行 
为 提供 了 一 种 为 目前 技术 全 新 的 方法 。 

执行 层 采用 一 种 新 的 时 间 算 法 来 解决 综合 约束 问题 ， 由 此 使 得 在 动态 环境 中 
随时 间 跟 踪 解 决 方案 ， 协 调 团队 间 的 解决 方案 ， 并 利用 团队 内 部 的 分 布 式 计算 
能 力 。 

将 该 方法 应 用 于 机 器 人 足球 来 进行 评估 ， 相 对 于 非 可 靠 通 信 ， 更 关注 于 反应 
性 和 重 棱 性。 在 外 星 探 索 领域 中 ,勾勒 出 一 些 先进 技术 来 描述 机 器 人 动态 编队 。 
最 后 ， 对 ALICA 的 可 扩展 性 进行 研究 ， 并 利用 一 个 常用 搜救 场景 与 目前 最 先进 
的 方法 进行 比较 。 
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1.1 研究 目的 


自从 Shakey 机 器 人 通过 STRIPS (斯 坦 福 研究 所 的 问题 求解 器 ) ” 控制 其 行 
为 在 斯 坦 福 大 学 里 自主 漫游 开始 ， 个 体 机 器 人 就 已 成 为 一 个 非常 活跃 的 研究 领 
域 "””  。 尽 管 自 此 以 后 ， 在 机 器 人 、 人 工 智能 和 机 器 学 习 领 域 取 得 了 大 量 的 研究 
成 果 ， 但 直到 近年 来 机 器 人 才 开始 出 现在 人 们 的 日 常生 活 中 。 如 今 ， 机 器 人 已 作 
为 社会 辅助 技术 成 功 应 用 于 医院 ”的 外 科 手 术 工 具 "“  ， 并 预计 在 不 远 的 将 来 可 
AFR 。 

然而 ， 随 着 机 器 人 与 现代 社会 和 经 济 的 深入 结合 ， 将 不 断 要 求 机 器 人 在 现代 
化 日 常生 活 的 动态 环境 中 需 具 有 智能 性 和 自 适应 性 行为 能 力 。 除 了 日 常生 活 之 
外 ， 机 器 人 的 另 一 个 主要 目标 是 为 人 类 无 法 到 达 或 具有 高 度 危 险 性 的 区 域 提 供 一 
种 设计 巧妙 的 机 器 。 这 些 领 域 包括 灾难 性 事件 的 搜救 与 救援 、 太 空 探索 或 未 来 小 
行星 开采 '”  。 而 且 ， 这 些 机 器 还 可 完成 过 于 重复 性 的 任务 。 

在 上 述 应 用 场景 中 ， 潜 在 的 异 构 机 器 人 团队 具有 较 大 优势 。 团 队 机 器 人 比 个 
体 机 器 人 具有 更 高 的 鲁 棒 性 ， 并 可 在 同一 时 间 内 搜索 更 大 的 区 域 。 此 外 ， 对 于 一 
个 已 处 于 工作 状态 的 机 器 人 ， 集 成 一 个 新 机 器 人 通常 要 比 集成 一 个 新 的 特殊 功能 
部 件 更 容易 。 然 而 ， 与 个 体 机 器 人 操作 相 比 ， 让 团队 机 器 人 以 高 效 、 重 棒 的 方式 
进行 工作 要 面临 更 大 的 挑战 。 整 个 团队 应 相互 协调 ， 对 动态 环境 作出 协调 一 致 的 
反应 ， 并 对 丧失 行为 能 力 的 团队 成 员 进 行 补偿 。 所 有 这 些 问题 都 需要 以 一 种 自 适 
应 分 布 式 方式 实时 处 理 ， 这 是 因为 采用 任何 一 种 集中 控制 机 制 都 将 失去 团队 机 器 
人 的 最 大 优势 ， 即 对 于 发 生 故 障 部 件 的 鲁 棒 性 。 

在 上 述 情况 下 ， 创 建 一 个 可 实现 期 望 目标 的 解决 方案 或 规划 是 一 项 艰巨 任 
务 ， 无 论 该 解决 方案 是 否 由 规划 算法 生成 ， 或 由 相关 领域 专家 建 模 ， 或 在 规划 过 
程 中 交互 生成 。 因 此 ， 具 有 期 望 行为 的 上 述 解决 方案 的 底层 执行 至 关 重要 ， 即 使 
在 感知 噪声 较 大 、 团 队 成 员 之 间 不 可 靠 通 信 以 及 条 件 动态 变化 的 困难 情况 下 。 
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在 更 高 层 解决 方案 与 团队 表现 行为 的 相互 关系 方面 ， 解 决 方案 的 编程 语言 是 
一 项 重要 因素 。 编 程 语 言 ， 或 对 编程 语言 的 基本 表征 ， 必 须 被 所 有 参与 方 理解 ， 
包括 系统 开发 人 员 、 规 划算 法 或 执行 屋 。 因 此 ， 编 程 语言 应 具有 规范 的 语义 ， 从 
而 可 验证 个 体 机 器 人 均 遵 循 一 个 共同 理解 。 另 外 ， 编 程 语 言 必须 具有 足够 的 表达 
能 力 来 描述 团队 机 器 人 所 处 的 各 种 场景 。 

在 搜索 和 救援 场景 中 ， 团 队 机 器 人 必须 应 对 动态 变化 的 情况 ， 包 括 可 能 存在 
环境 急剧 变化 、 个 体 机 器 人 失效 以 及 通信 不 可 靠 等 情况 。 在 这 些 情 况 下 ， 执 行 层 
的 作用 尤为 重要 。 针 对 每 种 新 情况 ， 组 件 评估 包括 是 否 继续 某 一 项 行为 动作 ， 或 
应 立即 修复 ， 或 必须 完全 中 止 。 然 后 ， 选 择 适 当 的 修复 机 制 ， 并 触发 更 高 层 的 元 
素 ， 如 规划 算法 (如 果 需 要 的 话 )。 根 据 具体 情况 ,或 许 不 需要 通信 的 迅速 反 
应 ， 在 其 他 情况 下 ， 则 需要 团队 成 员 之 间 进 行 通信 来 解决 冲突 。 除 此 之 外 ， 正 是 
该 元 素 使 得 期 望 行为 的 符号 描述 与 底层 执行 器 相关 联 。 换 名 话说 ， 即 将 物理 行为 
的 动作 符号 具体 化 。 这 样 ， 执 行 层 就 可 支持 高 层 规划 和 学 习 的 认 知 能 力 。 

最 后 ， 编 程 语 言 应 能 将 具体 部 分 的 复杂 性 进行 抽象 ， 如 在 某 一 时 刻 ， 系 统 设 
计 者 只 需 关注 具体 问题 。 这 就 要 求 编程 语言 应 支持 关注 点 分 离 和 组 件 的 可 重 
用 性 。 


1.2 问题 描述 


本 书 的 目的 是 为 团队 协作 自主 机 器 人 的 行为 建 模 和 控制 提供 一 个 综合 解决 方 
案 。 该 方案 包括 两 大 部 分 : 一 是 描述 机 器 人 团队 行为 的 编程 语言 ; 二 是 将 编程 语 
言 中 的 具体 元 素 看 作 程序 并 有 效 和 重 棒 地 执行 相应 执行 层 。 

为 便于 后 续 编 程 工具 的 支持 ， 以 及 允许 将 来 嵌入 到 其 他 编程 语言 或 将 其 他 编 
程 语言 移植 进来 ， 建 模 语言 必须 具有 清晰 规范 的 语义 。 根 据 所 处 的 领域 和 场景 ， 
编程 语言 元 素 ( 如 程序 ) 将 由 开发 人 员 编 写 或 通过 规划 或 学 习 算 法 自动 生成 。 

与 将 在 第 3 章 中 介绍 的 目前 已 有 的 许多 编程 语言 和 框架 相 比 ， 该 编程 语言 
架 可 支持 全 局 建 模 ， 使 得 设计 者 只 关注 于 较 高 抽象 层次 上 的 协作 问题 ， 而 无 需 处 
理 相 互 作 用 的 多 个 具体 程序 。 同 时 ， 该 编程 框架 还 可 允许 目标 任务 内 部 结构 之 间 
的 精细 建 模 。 

如 前 所 述 ， 本 书 所 提出 的 编程 语言 必须 以 一 种 简洁 、 明 确 的 方式 来 实现 复杂 
行为 的 规范 化 。 由 于 具体 行为 总 是 与 特定 领域 的 机 器 人 相关 〈 如 位 置 ) ， 因 此 该 
编程 语言 必须 能 够 描述 这 些 机 器 人 的 相关 特性 ， 同 时 还 需 保留 其 与 领域 无 关 的 本 
质 。 在 此 ， 将 一 类 约束 满足 和 优化 问题 集成 到 该 编程 语言 中 ， 并 对 执行 层 配 置 一 
个 相应 的 求解 器 。 

本 书 主要 考虑 需要 快速 反应 并 推理 的 动态 场景 。 更 具体 而 言 ， 即 执行 平台 必 


须 可 应 对 一 个 具有 下 列 情况 的 动态 环境 : 

e 状态 连续 实时 变化 ， 如 在 推理 时 。 

© 传感器 存在 噪声 ， 执 行 层 需 具 有 一 定 的 抗 扰 性 。 

@ 环境 部 分 可 见 ， 机 器 人 无 法 在 长 时 间 内 有 效 预测 其 行为 。 

© 通信 不 可 靠 。 在 此 假设 概率 大 于 0 时 才 可 通信 ， 时 常 发 生 丢 包 和 延迟 。 

o 个 体 机 器 人 随时 都 可 失控 或 形 失 部 分 功能 。 只 要 有 可 能 ， 团 队 机 器 人 性 
能 应 适度 降低 。 这 不 包括 采用 任何 核心 部 件 。 

在 这 些 特 性 之 间 存 在 某 种 程度 的 内 部 关联 ， 这 需要 在 本 书 的 工作 中 进行 平 
衡 。 首 先 ， 在 处 理 动 态 环境 下 感知 噪声 时 ， 对 噪声 的 反应 性 和 抗 扰 性 是 两 个 相互 
冲突 的 目标 。 同 理 ， 在 高 动态 环境 下 ， 通 信也 不 同步 ， 因 此 所 接收 的 消息 总 是 针 
对 之 前 状态 的 。 尤 其 是 ， 如 果 智 能 体 时 钟 不 能 严格 同步 ， 随 着 环境 的 突然 变化 ， 
信息 包 的 延迟 也 会 相应 增 大 。 一 般 来 说 ， 更 注重 对 噪声 的 反应 性 ， 而 不 是 抗 扰 
性 ， 然 而 本 书 中 的 编程 框架 可 将 任何 一 种 感知 处 理 方法 和 噪声 处 理 聚 类 方法 相 结 
合 。 其 次 ， 智 能 体 失效 与 数据 包 丢 失 没有 区 别 ， 除 非 智能 体 动 作 可 通过 感知 数据 
来 观测 。 最 后 ， 反 应 行为 和 协作 行为 也 是 两 个 相互 冲突 的 目标 。 如 果 进 行 决策 时 
需要 通信 ， 则 无 法 实现 较 高 的 反应 行为 。 另 一 方面 ， 通 信 或 许 是 目前 唯一 可 行 的 
实现 合作 的 方式 。 因 此 ， 需 要 一 种 自 适应 性 方法 ， 在 没有 前 期 通信 的 情况 下 进行 
快速 决策 ， 如 果 有 必要 ， 应 切换 到 具有 高 度 一 致 性 协议 的 低层 次 反应 决策 。 

由 于 与 多 机 器 人 系统 相关 的 研究 领域 有 许多 ， 本 书 中 不 考虑 以 下 研究 内 容 : 

传感器 融合 一 一 对 于 异 构 机 器 人 团队 中 的 传感器 融合 ，Reichle'"” 进行 了 详 
细 讨 论 。 在 所 有 的 场景 中 ， 均 假设 已 具有 合适 的 传感器 融合 算法 ， 由 此 在 该 基础 
上 进行 决策 。 

协同 系统 一 一 在 协同 系统 中 ， 每 个 个 体 机 器 人 都 具有 潜在 的 不 同 目标 ， 这 些 
不 同 目标 暂时 保持 一 致 并 保证 形成 可 实现 共同 目标 的 联合 体 。 在 此 ， 假 设 所 有 机 
器 人 都 具有 相同 的 全 局 目标 ， 并 在 整个 生命 周期 内 构成 一 个 团队 。 

规划 一 一 规划 算法 可 生成 全 部 或 部 分 有 序 行为 序列 ， 以 实现 特定 目标 。 在 此 
并 不 制定 或 集成 规划 算法 ， 然 而 可 提供 一 种 易于 描述 规划 算法 的 编程 语言 。 


1.3 应 用 场景 


接 下 来 ， 简 单 介 绍 用 于 开发 和 评估 本 书 研究 成 果 的 应 用 场景 。 值 得 注意 的 
是 ， 本 书 方法 并 不 局 限于 这 些 领域 ,并 可 非常 方便 地 应 用 到 其 他 领域 。 在 本 书 方 
法 中 重点 强调 的 是 特定 领域 机 器 人 与 普通 机 器 人 之 间 的 不 同 。 因 此 ， 关 于 领域 的 
描述 是 易于 更 换 的 。 
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1.3.1 机 器 人 足球 

RoboCup 是 在 机 器 人 、 人 工 智 能 以 及 相关 领域 许多 国家 深入 研究 并 努力 发 展 
的 项 目 。 其 核心 是 不 同 国家 联赛 的 一 个 年 度 竞 赛 ， 并 具有 一 个 愿景 : 

“到 21 世纪 中 叶 ， 按 照 FIFA 的 官方 规则 ， 一 支 完 全 由 自主 人 形 机 器 人 组 成 
的 足球 运动 员 在 与 当时 世界 杯 冠军 的 足球 对 抗 赛 中 获胜 ”RoboCup WA 。 

出 于 这 个 美好 愿望 ，RoboCup 也 致力 于 一 个 主要 的 研究 内 容 ， 即 机 器 人 足 
球 。 自 从 1996 年 开始 首次 比赛 以 来 ，RoboCup 目前 已 得 到 广泛 普及 并 扩展 了 许 
多 其 他 领域 ， 如 搜救 机 器 人 和 家 庭 服务 环境 机 器 人 ， 然 而 简单 并 具有 巨大 挑战 
的 足球 比赛 仍 是 其 主要 关注 的 领域 。 相 对 于 其 他 研究 领域 ， 足 球 比赛 领域 具有 
很 多 优势 : 首先 ， 足 球 是 一 种 众 所 皆 知 的 体育 项 目 ， 因 此 无 需 过 多 解释 即 可 引 
起 普通 大 众 的 关注 ; 另外 ， 还 是 一 个 以 对 抗 方式 对 不 同方 法 进行 评估 的 测试 平 
台 ; 而 且 在 足球 比赛 中 ， 每 个 个 体 运动 员 的 能 力 技巧 与 团队 配合 同样 重要 。 因 
此 ， 需 要 具备 个 人 能 力 以 及 团队 配合 能 力 ， 才 能 组 成 一 支 优秀 的 机 器 人 足球 
队 。 最 后 ， 足 球 是 一 项 快 节奏 的 项 目 ， 需 要 高 度 的 反应 能 力 和 速度 。 这 种 需求 
使 得 机 器 人 足球 不 同 于 典型 的 实验 室 配置 ， 必 须 满足 参加 机 器 人 足球 所 需要 的 
基本 要 求 。 

本 书 中 所 涉及 RoboCup 领域 ， 重 点 关注 一 种 特定 的 RoboCup 联赛 ， 即 中 型 
组 比赛 (MSL) 。 在 MSL 中 ,5 个 机 器 人 组 成 的 队伍 要 在 一 块 18m x 12m 的 场地 
上 相互 对 抗 。 该 比赛 包括 上 下 两 个 半 场 ， 每 个 半 场 进行 15min。 采 用 标准 的 FIFA 
足球 进行 比赛 。 在 比赛 中 ， 每 个 机 器 人 完全 自主 行动 ,严格 禁 止 人 为 操作 。 目 
前 ， 参 赛 机 器 人 最 大 80cm 高 ， 不 超过 40kg 重 。 大 多 数 机 器 人 采用 全 驱 运 动 ， 以 
及 一 个 独立 的 踢 球 装置 进行 长 距离 传 球 。 机 器 人 之 间 通 过 无 线 局 域 网 进行 通信 。 
比赛 是 高 度 动态 的 ， 机 器 人 可 达到 Sm/s 的 速度 ， 带 球 运动 速度 可 达到 约 12m/s。 
鉴于 在 理想 状态 下 ， 机 器 人 配置 的 典型 传感器 感知 范围 不 大 于 10m， 通 常 小 于 
6m， 对 于 机 器 人 性 能 而 言 ， 反 应 速度 尤为 关键 。 除 此 以 外 ， 机 器 人 还 需 协 调 一 
致 地 行动 和 反应 。 在 本 书 的 研究 工作 中 ， 在 保证 机 器 人 团队 相互 协调 以 形成 一 致 
行动 的 情况 下 ， 尽 可 能 地 保持 快速 反应 时 间 。 

1.3.2 探索 

在 自主 移动 机 器 人 应 用 中 ， 探 索 任务 是 一 个 非常 有 益 的 应 用 场景 。 执 行 探索 
任务 时 的 环境 通常 是 难以 到 达 第 一 现场 或 对 人 类 具有 危险 性 的 地 方 。 例 如 ， 对 于 
外 星 探索 任务 ， 就 同时 具有 上 述 两 个 特点 。 而 且 ， 天 体 之 间 的 超 远 距离 也 难以 下 
控 机 器 人 ， 甚 至 根本 无 法 实现 。 因 此 ， 关 键 在 于 要 赋予 探索 机 器 人 一 定 程度 的 自 
治 性 。 

IMPERA 研究 项 目 就 是 针对 上 述 场景 开展 研究 的 ， 该 项 目 是 由 Kassel 大 学 的 
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DFKIS2 机 器 人 创新 中 心 联合 分 布 式 系统 研究 团队 ， 并 与 DLRS 合 作 共同 完成 的 。 
基于 团队 机 器 人 要 比 单个 机 器 人 更 具有 重 棒 性 和 容错 性 ， 并 且 任 务 完成 (如 探 
索 任 务 ) 要 更 加 快速 的 思想 ，IMPERA 主要 针对 外 星 环境 下 机 器 人 的 协调 合作 进 
行 深入 研究 。 

尽管 在 火星 或 月 球 环境 下 ， 机 器 人 的 动态 性 远 不 及 足球 比赛 的 环境 ， 但 还 需 
考虑 1.2 节 中 讨论 的 其 他 特性 。 然 而 ， 团 队 机 器 人 本 身 可 通过 与 外 界 环 境 的 交互 
在 一 定 程 度 上 降低 动态 性 。 

本 书 所 提 方 法 仅 作为 IMPERA 在 外 星 探索 任务 环境 下 协调 控制 机 器 人 的 基本 
方法 。 尤 其 值得 注意 的 是 ，IMPERA 利用 先进 规划 算法 对 本 书 方法 进行 扩展 。 
1.3.3 搜救 

在 搜救 场景 下 ， 机 器 人 可 完成 多 种 潜在 任务 。 例 如 ， 机 器 人 可 作为 救援 人 员 
在 大 范围 区 域内 搜索 幸存 者 、 提 供 通信 网 络 、 清 除 上 废墟 、 进 入 摇摇欲坠 的 建筑 
物 。 在 本 书 中 ， 根 据 RoboCup 救援 仿真 比赛 ， 重 点 研究 一 个 简单 场景 。 在 该 场 
景 中 ， 智 能 体 将 在 城市 中 的 多 个 着 火 点 进行 灭火 任务 。 在 此 采用 Kleiner 等 人 
提出 的 RMAS- BENCH 来 模拟 仿真 该 基本 问题 。 在 搜救 领域 ， 需 要 比 探索 或 足球 
比赛 领域 更 多 的 智能 体 进 行 协调 合作 。 


1.4 研究 方法 


如 上 所 述 ， 本 书 所 提出 的 解决 方案 包括 一 种 编程 语言 和 相应 的 执行 层 。 为 抽 
象 化 执行 过 程 中 行为 描述 和 具体 机 器 人 之 间 的 关系 ， 采 用 行为 描述 中 机 器 人 与 任 
务 之 间 的 两 个 映射 关系 。 根 据 具体 执行 器 和 感知 器 、 智 能 体 或 机 器 人 所 具有 的 个 
体能 力 与 相应 的 角色 相对 应 。 这 些 角 色 又 决定 着 该 智能 体 所 能 完成 的 任务 以 及 执 
行程 度 。 这 种 映射 关系 完全 按照 Wooldridge 等 人 "所 提出 的 思想 。 由 此 ， 团 队 
机 器 人 行为 与 运行 时 的 具体 机 器 人 相互 独立 ， 而 且 团队 机 器 人 也 可 独立 指定 后 续 
应 解决 的 问题 。 

团队 行为 程序 是 一 种 多 个 有 限 状态 机 的 层次 结构 。 状 态 机 的 每 个 状态 中 都 
包含 多 个 子 程序 ， 这 意味 着 可 由 继承 该 状态 的 所 有 智能 体 执行 。 每 一 层 中 的 条 
件 和 效用 函数 决定 哪个 智能 体 执行 哪 种 状态 机 。 每 个 智能 体 对 这 些 条 件 和 函数 
进行 局 部 评估 ， 以 实现 高 度 反 应 行为 。 该 层次 结构 隐藏 了 每 层 中 较 低 层次 的 复 
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6 ”自主 移动 机 器 人 行为 建 模 与 控制 


通过 冲突 检测 和 冲突 消解 机 制 ， 对 基本 编程 语言 进行 扩展 ， 即 选择 一 个 领导 
者 来 暂时 切换 决策 协议 ， 从 而 解决 检测 到 的 冲突 。 然 后 ， 相 对 于 冲突 时 的 决策 ， 
该 领导 者 只 对 团队 其 他 成 员 发 布 命令 。 冲 突 解决 后 ， 团 队 又 切换 回 其 初始 状态 ， 
具有 更 多 的 动态 决策 模式 。 

最 后 ， 利 用 约束 来 描述 机 器 人 应 具有 的 目标 值 。 在 动态 约束 优化 问题 中 的 这 
种 结果 由 团队 成 员 实 时 求解 。 在 此 对 该 任务 中 的 非 线性 连续 约束 优化 问题 提供 一 
种 有 效 的 任意 求解 器 。 随 着 环境 以 及 相应 的 优化 问题 的 变化 ， 该 求解 器 可 跟踪 解 
决 方案 。 而 且 在 解决 难题 时 ， 团 队 成 员 相 互 合 作 ， 因 此 可 比 单个 智能 体 更 快 地 找 
到 解决 方案 。 最 后 ， 求 解 算法 使 得 团队 合作 解决 ， 从 而 得 到 一 致 结果 。 执 行 层 管 
理 活动 约束 集合 ， 使 得 任何 部 分 都 按照 变量 值 进行 排列 。 作 为 声明 描述 的 非 合作 
约束 ， 将 其 添加 到 编程 语言 中 是 非常 有 利 的 。 

© 极 大 地 简化 建 模 任 务 ， 并 减少 所 需 的 不 可 分 行为 的 个 数 。 

o 只 要 约束 之 间 的 数据 关系 清楚 ， 易于 对 约束 进行 扩展 和 联合 。 例 如 ， 可 
直接 构建 两 个 约束 满足 问题 之 间 的 交集 。 

© 与 专用 程序 相 比 ， 无 需 处 理 太 多 的 特殊 情况 。 

o 通过 规划 和 学 习 算 法 ， 数 学 描述 与 具体 实现 的 直接 对 应 可 生成 约束 。 

o 最 重要 的 是 ,约束 提供 一 种 以 数值 形式 来 进行 符号 行为 描述 的 方式 ， 这 
可 传递 到 较 低 层次 单元 ， 如 电动 机 控制 器 。 

当然 ， 所 提 方 法 也 有 其 缺点 。 一 个 通用 求解 器 在 效率 方面 总 是 超出 具体 问题 
解决 方案 的 执行 。 因此， 设计 一 个 专用 程序 来 处 理 特定 任务 肯定 会 比 解决 同样 问 
题 基 于 约束 的 解决 方案 更 加 有 效 。 


1.5 创新 与 贡献 


本 书 的 主要 贡献 在 于 为 团队 机 器 人 的 行为 描述 提供 一 种 全 面 的 解决 方案 。 在 
此 介绍 的 范例 组 合 为 多 机 器 人 系统 的 合作 行为 提供 一 种 全 新 方法 。 称 为 ALICA 
(交互 式 协作 智能 体 语言 ) 的 方法 包含 功能 描述 、 角 色 分 配 、 类 似 于 层次 状态 机 
的 任务 描述 、 基 于 效用 函数 的 任务 分 配 、 通 过 同步 转换 的 显 式 协调 、 广 播 计算 方 
式 的 隐 式 协调 以 及 通过 切换 正在 采用 的 决策 协议 来 进行 冲突 检测 和 冲突 消解 。 最 
后 ,与 非 线 性 约束 满足 问题 相 结 合 ， 以 允许 特定 域 实体 内 的 推理 (如 关节 位 置 
和 配置 ) 。 在 此 ， 将 该 全 面 综合 的 组 合 方式 作为 本 书 的 最 大 贡献 。 

自从 2009 年 ， 该 方法 已 成 功 应 用 于 参加 RoboCup MSL 比赛 的 机 器 人 队伍 
Carpe Noctem 中 ， 并 且 现 已 应 用 于 IMPERA 研究 项 目 。 在 基于 BSD 的 开放 源 代码 
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协议 下 ， 可 提供 源 代码 9 。 

在 理论 方面 ， 将 新 方法 引入 分 层 任务 分 配 中 ， 根 据 任务 结构 的 不 同 需求 ， 可 
产生 两 种 不 同 的 分 配 机 制 。 而 且 提出 一 种 任意 约束 优化 求解 器 ， 将 现 有 的 用 于 非 
线性 连续 满足 问题 的 先进 方法 进行 扩展 。 值 得 注意 的 是 ， 该 方法 具有 随时 间 跟 踪 
解决 方案 的 能 力 ， 并 提供 团队 内 部 的 合作 解决 方案 ， 以 及 在 保证 单个 机 器 人 反应 
能 力 下 的 分 布 式 问题 求解 能 力 。 


1.6 结构 安排 


本 书 分 为 4 个 部 分 。 第 1 部 分 中 的 其 余 章节 主要 包括 : 第 2 章 介绍 本 书 工作 
的 基础 知识 ， 接 下 来 在 第 3 章 中 介绍 与 本 书 所 提 方 法 相关 的 研究 工作 。 

第 2 部 分 主要 详细 介绍 ALICA 的 命题 式 核心 语言 。 在 第 4 章 介绍 ALICA 基 
本 语法 之 后 ， 第 5 章 逐 一 介绍 相关 语义 。 在 该 部 分 中 重点 阐述 任务 分 配 和 基于 规 
则 的 执行 ， 这 些 将 构成 后 续 章 节 的 基础 。 

第 6 章 中 通过 增加 冲突 检测 和 冲突 消解 对 基本 语义 进行 扩展 。 推 导 了 域 无 关 
的 冲突 检测 机 制 ， 这 可 对 团队 合作 中 的 持续 冲突 进行 可 靠 检测 。 之 后 ， 提 出 了 一 
种 基于 局 部 领导 者 选举 的 冲突 消解 方法 。 在 第 2 部 分 的 结尾 ， 即 第 7 章 中 ， 详 细 
介绍 了 关键 的 软件 架构 和 具体 实现 。 

第 3 部 分 ， 通过 考虑 变量 和 约束 条 件 对 命题 式 语言 进行 扩展 。 相 应 地 ， 在 第 
8 章 中 介绍 了 语法 和 操作 语义 ， 以 适用 于 额外 的 编程 语言 元 素 。 接 着 ， 在 第 9 章 
中 推导 并 详细 讨论 了 一 种 适当 的 约束 求解 算法 。 本 章 的 其 余部 分 解释 了 如 何 随时 
间 跟 踪 解 决 方案 ， 以 及 如 何 实现 非 命题 式 情况 下 的 合作 。 

第 4 部 分 重点 关注 所 提 解 决 方案 的 评估 和 讨论 。 第 10 章 中 给 出 了 全 面 的 评 
佑 结果 。 利 用 机 器 人 足球 、 探 索 和 搜救 等 场景 ， 着 重 讨论 了 不 同 场景 下 ， 网 络 较 
差 条 件 下 的 和 鲁 棒 性 ， 噪 声 条 件 下 的 鲁 棒 性 ， 建 模 能 力 ， 可 扩展 性 和 适用 性 。 在 第 
11 章 中 进行 总 结 ， 并 展望 今后 的 研究 工作 。 


1.7 惯例 与 约定 


为 简单 起 见 ， 在 此 假设 本 书 中 的 符号 约定 如 下 : 
© 有 限 集 的 减法 运算 用 - 表示: 


A-B =\alacAhagB} 


© http; //ros. org/wiki/cn- alica- ros- pkg, 
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@ 除 男 有 特殊 说 明 ， 公 式 中 的 自由 变量 均 统一 量化 。 
@ 在 一 阶 方程 中 采用 如 下 缩写 : 


(VeeS)o = (Vaz) 


人 
@ 在 通常 意义 下 ， 用 img(f) KIR BEHR KX fo 
o 2 表示 集合 S NE. 
@ 在 特意 提 及 术语 或 公式 中 的 自由 变量 时 ， 用 vars(p) 表示 术语 或 公式 p 中 
的 自由 变量 集 。 


第 2 章 基础 理论 


本 章 简要 介绍 本 书 工作 的 主要 基础 理论 : 2. 1 节 介 绍 了 智能 体 的 概念 ; 接 下 
来 的 2.2 节 介 绍 了 不 同 多 智能 体系 统 的 分 类 ; 2. 3 节 主 要 阐述 了 文献 中 团队 合作 
的 主要 理论 ; 最 后 ，2. 4 节 对 约束 规划 进行 了 概述 。 


2.1 智能 体 
智能 体 概念 已 广泛 应 用 于 各 种 配置 。 研 究 人 员 将 智能 体 作为 一 种 软件 技术 实 
体 (如 参考 文献 [115] 中 所 述 )、 一 种 模拟 生态 系统 行为 的 方法 ( 如 参考 文献 


[61] 中 所 述 ) 以 及 区 分 环境 和 内 部 的 人 工 智能 概念 进行 了 深入 研究 。 

“智能 体 是 一 种 通过 传感器 感知 其 周围 环境 并 通过 执行 器 作用 于 环境 的 任何 
事物 。” Russell 和 Norvig[39 ,第 3 页] > 

这 或 许 是 文献 中 最 通用 的 智能 体 定义 。 尽 管 各 个 模块 中 具体 步骤 的 名 称 和 个 
数 或 许 不 同 ， 但 一 个 智能 体 通常 都 是 按 图 2. 1 所 示 的 循环 流程 来 实现 的 。 

首先 对 传感器 输入 数据 进行 处 理 ， 所 得 结果 用 于 可 产生 行为 决策 的 推理 步 
又 。 反 过 来 ， 执 行 该 行为 又 将 改变 外 界 环 境 ， 由 此 导致 不 同 输入 。 根 据 如 何 实现 
上 述 步 又 ， 采 用 何 种 内 部 模型 以 及 智能 体 适 用 于 何 种 环境 ， 具 有 多 种 不 同 的 智能 
体 分 类 形式 。Russell 和 Norvig ”对 此 进行 了 详细 、 全 面 的 综述 。 在 此 ， 仅 讨论 
其 中 三 种 不 同 的 智能 体 模型 ， 即 理性 智能 体 、BDI (信任 、 期 望 和 意图 ) 智能 体 
和 推理 智能 体 。 

理性 智能 体 ”最 大 限度 地 发 挥 其 预期 的 性 能 指标 。 即 以 一 种 决策 理论 最 优 方 
式 进行 行为 动作 ， 并 提供 有 关 回 报 和 概率 发 生 的 正确 信息 。 

BDI 智能 体 ”基于 Bratman”! 所 提出 的 BDI 模型 。BDI 着 重 于 一 种 具有 特殊 
理念 的 实际 推理 方法 。 信 任 表 示 智 能 体 对 于 环境 (包括 其 本 身 和 其 他 智能 体 ) 
的 信息 状态 ; 期 望 表示 智能 体 想 要 完成 或 实现 的 目标 与 状况 ; 意图 表示 智能 体会 
选择 何 种 行为 的 慎 思 状态 。 这 种 实用 方法 已 取得 很 大 成 功 ， 并 产生 基于 BDI 模 
型 的 多 种 编程 语言 。 

推理 智能 体 ”按照 推理 是 以 某 种 逻辑 形式 进行 演绎 推理 这 一 人 工 智能 方面 的 
经 典 观 点 。 该 领域 的 研究 主要 集中 于 如 何 对 知识 进行 表示 以 适用 于 功能 强大 的 推 
理 技术 。 该 领域 的 基础 研究 工作 应 追溯 到 Mc Carthy 和 Hayes "的 相关 研究 。 推 
理智 能 体 中 两 种 最 具 影 响 力 的 演算 方法 是 情境 演算 "” 和 流 演算 ， 
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尽管 ALICA 的 灵感 来 源 于 BDI 模型 ， 并 可 看 作 一 种 BD 语言 ， 但 本 书 的 工 
作 与 上 述 三 种 智能 体 模 型 均 兼 容 。 在 随后 的 内 容 中 ,“ 智 能 体 ” 与 “机 器 人 ”可 
相互 替换 。 


输入 感知 信息 


图 2.1 智能 体 执行 循环 流程 


2.2 多 智能 体系 统 


根据 智能 体 的 概念 ， 目 前 包含 多 个 智能 体 的 系统 仍 是 研究 热点 。 这 种 系统 具 
有 多 种 分 类 方法 ， 如 基于 单个 智能 体 的 能 力 、 基 于 所 用 的 组 织 隐喻 以 及 根据 智能 体 
EREE. Wooldridge ”对 于 多 智能 体系 统领 域 进行 了 全 面 、 详 细 的 综述 。 
其 中 主要 是 从 多 智能 体 合 作 方 面 进 行 曾 述 。 一 个 多 智能 体系 统 可 分 类 如 下 : 

合作 ”意味 着 所 有 智能 体 都 试图 达到 同一 个 全 局 目标 ， 因 此 将 以 任何 有 利于 
实现 该 目标 的 方式 相互 合作 。 

协作 ”智能 体 无 需 实现 同一 目标 ,但 各 个 子 目标 相互 兼容 。 因 此 ， 每 当 单 个 
子 目 标 一 致 时 ， 这 些 智能 体 就 形成 联盟 。 与 合作 系统 相 比 ， 协 作 系 统 的 组 织 结构 
将 更 加 动态 ， 这 是 由 于 团队 成 员 可 在 系统 内 不 断 组 合 和 解散 。 

中 立 ”智能 体 具 有 各 自 不 同 的 目标 且 相 互 无 关 ， 如 果 发 生 任何 形式 的 合作 都 
纯 属 偶然 。 

Mit ”智能 体 具有 相互 直接 竞争 的 目标 ， 即 某 个 智能 体 达到 其 目标 后 ， 意 味 
着 其 余 智能 体 将 不 能 再 达到 该 目标 。 

一 般 而 言 ， 上 述 分 类 并 不 严格 ,实际 系统 中 可 以 具有 各 个 分 类 的 特征 或 特 
性 。 如 机 器 人 足球 中 ， 每 个 队伍 都 组 成 一 个 完全 合作 系统 ， 且 团队 中 的 每 个 成 员 
完全 利他 。 当 然 ， 在 进行 比赛 时 ， 两 个 队伍 所 构成 的 多 智能 体系 统 是 相互 对 
抗 的 。 
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在 本 书 的 研究 工作 中 ， 仅 考虑 完全 合作 的 系统 。 当 所 研究 的 场景 中 具有 比赛 
对 手 队 伍 时 ， 并 不 关心 分 析 每 个 足球 机 器 人 的 整体 行为 ， 而 只 是 对 整个 队伍 的 行 
为 进行 建 模 。 换 句 话 说 ， 由 于 无 法 控制 对 手 队伍 的 行为 ， 因 此 只 是 将 其 看 作 外 部 
环境 的 一 部 分 。 

由 大 量 典型 同 构 机 器 人 组 成 ， 且 每 个 机 器 人 的 感知 与 通信 能 力 相 对 简单 的 多 
智能 体系 统 是 群体 智能 和 群体 机 器 人 领域 的 研究 热点 。 基 于 群体 的 方法 受 生 物 系 
统 启 发 (如 参考 文献 [119] 中 所 述 ) 。 另 一 方面 ， 将 一 组 机 器 人 建 模 为 一 个 团 
队 时 ， 假 设 个 体 机 器 人 已 足以 进行 相对 复杂 的 推理 。 在 2.3 节 中 ， 将 介绍 有 关 团 
队 机 器 人 合作 的 主要 理论 。 

除了 群体 和 团队 外 ， 还 有 许多 其 他 不 同 的 方法 来 组 成 多 智能 体系 统 。Horling 
和 Lesser ”针对 不 同 典 型 系统 进行 了 全 面 概述 : 

层次 结构 “在 层次 结构 中 ， 较 高 层 的 智能 体 要 比 低层 智能 体 更 具有 全 局 观 。 
通常 ， 智 能 体 只 与 通过 树 形 结构 直接 相连 的 其 他 智能 体 进 行 通信 。 数 据 是 自 下 而 
上 的 通信 ， 而 控制 指令 则 是 自 上 而 下 。 层 次 结构 相对 简单 ， 且 与 层次 目标 或 任务 
树 之 间 的 关系 清晰 ， 但 该 结构 相对 固定 且 适 应 性 差 ， 具有 单 点 故障 的 特点 。 

合 弄 结构 (Holarchy) ” 合 弄 结构 是 一 种 类 似 于 层次 结构 的 自然 启发 式 结构 ， 
其 中 ， 除 某 种 部 件 外 ， 在 每 个 层次 中 构成 一 个 群体 ， 而 这 些 部 件 又 是 较 低 层次 中 
抽象 部 分 的 部 件 群体 。 在 最 底层 ， 多 个 智能 体 构成 一 组 。 因 此 ， 合 弄 结 构 可 看 作 
不 严格 的 层次 结构 ， 允 许 单个 智能 体 之 间 具 有 更 多 通信 以 及 更 多 的 自治 。 

联盟 联盟 是 基于 上 述 的 协作 智能 体 思 想 。 在 此 ， 为 实现 共同 目标 ， 智 能 体 
构成 相对 短暂 的 平面 组 。 

团队 ”团队 是 由 为 实现 共同 目标 而 共同 工作 的 合作 智能 体 组 成 的 。 相 对 于 联 
盟 ， 这 是 一 个 完全 合作 系统 。 

集合 ”集合 是 相对 稳定 的 扁平 型 结构 智能 体 。 与 团队 相 比 ， 集 合 的 组 成 并 没 
有 一 个 统一 目标 ， 而 是 为 使 各 自 能 力 互补 相 结合 。 

社会 ”智能 体 社会 是 一 个 相对 稳定 的 开放 系统 ， 如 电子 市 场 。 智 能 体 具有 各 
自 不 同 目标 和 异 构 能 力 ， 并 通过 各 种 途径 交互 。 社 会 具有 一 系列 个 体 所 必须 遵循 
的 约束 条 件 ， 通 常 称 为 社会 法 律 或 规范 。 

联邦 ”在 智能 体 联 邦 中 ， 洪 在 的 复杂 智能 体 组 由 组 中 某 个 杰出 成 员 来 代表 。 
该 成 员 负 责 与 其 他 组 的 代表 进行 相互 通信 和 交互 。 

市 场 ” 相 对 于 社会 ， 市场 中 的 整个 交互 过 程 经 过 商业 交易 后 建 模 ， 如 商品 买 
卖 、 投 标 、 提 供 服务 等 。 这 些 交 易 通常 都 是 具有 竞争 性 的 ， 即 各 自 目 标 相互 
冲突 。 

矩阵 ”基于 抢 阵 的 智能 体 组 织 形式 可 对 权限 进行 多 维 定义 。 单 个 智能 体 必 须 
具有 足够 的 自治 权 以 应 对 可 能 由 不 同 权限 引起 的 潜在 的 局 部 冲突 。 
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复合 最 后 一 种 形式 基本 上 是 将 不 同 用 途 的 不 同 组 织 结构 相 结 合 ， 如 数据 
流 、 控 制 、 探 索 等 。 

由 于 本 书 主要 关注 具有 共同 目标 的 小 规模 机 器 人 组 ， 因 此 所 提 方 法 主要 分 析 
基于 团队 的 多 智能 体系 统 特性 。 


2.3 团队 合作 


在 文献 中 已 深入 分 析 了 智能 体 之 间 的 团队 合作 。 目 前 ， 利 用 智能 体 语 言 进 行 
团队 合作 建 模 的 大 多 数 方法 都 是 基于 以 下 两 种 基础 理论 中 的 一 种 。 

联合 意图 理论 

合意 图 框架 “… 是 基于 BDI 逻辑 的 理论 框架 。 该 框架 关注 于 团队 的 联合 
心理 状态 ， 称 为 联合 意图 。 如 果 在 特定 心理 状态 下 所 有 团队 成 员 共 同 致力 于 执行 
一 个 动作 ， 那 么 该 团队 就 会 共同 实现 一 个 团队 行为 。 

为 实现 一 个 共同 目标 ， 团 队 成 员 必 须 建立 一 个 合适 的 共同 信念 以 及 单个 承 
诺 。 尽 管 联 合意 图 理论 没有 强制 要 求 根 据 观 测 来 建立 行为 共同 信念 的 通信 以 及 相 
KER (参见 参考 文献 [75] ) ， 但 目前 而 言 ， 通 信 仍 是 获得 共同 承诺 的 唯一 可 
行 方法 。 联 合意 图 理论 中 一 个 非常 关键 的 方面 是 获得 有 关 团 队 行 为 终止 的 共同 信 
念 。 这 将 有 助 于 保证 团队 保持 行为 状态 更 新 。 通 过 强制 智能 体 提交 联合 意向 或 有 
关 故 障 或 提前 终止 的 团队 信息 来 实现 上 述 行为 。 联 合意 图 和 联合 提交 提供 了 一 种 
基本 框架 来 推理 有 关 合 作 以 及 监视 和 保持 团队 行为 的 监控 。 然 而 ， 高 层 团 队 目 标 
的 单个 联合 意图 不 足以 对 团队 行为 详细 建 模 ， 以 保证 一 致 的 合作 。 

共享 计划 理论 

与 联合 意图 相 比 ， 共 享 计划 理论 对 意图 采用 层次 结构 ， 由 此 克服 复杂 
团队 任务 中 单个 联合 意图 的 缺点 。 共 享 计划 理论 并 不 是 基于 联合 心理 状态 ， 而 是 
基于 称 为 打算 的 意图 状态 ， 这 与 一 个 智能 体 完 成 一 项 动作 的 通常 意图 非常 相似 。 
然而 ， 单 个 智能 体 的 打算 是 直接 面向 合作 者 行为 或 团队 联合 行为 。“ 打 算 ” 是 通 
过 一 组 指导 单个 智能 体 行为 〈 包 括 通信 ) 的 公理 来 定义 的 ， 使 得 便于 团队 合作 
者 、 子 团队 或 团队 完成 所 分 配 的 任务 。 

对 于 小 组 行为 ， 共 享 计划 具体 指定 了 关于 如 何 进 行 行为 和 子 行为 的 信 
念 '““ 。 形 式 化 模型 可 获得 单个 和 群体 行为 性 能 的 意图 和 提议 。 合 作 计划 由 共 
同 信念 、( 部 分 ) 配方 、 单 个 执行 动作 的 意图 、 合 作者 在 其 子 行为 中 成 功 的 单个 
打算 以 及 子 行为 的 单个 或 合作 计划 组 成 。 达 到 根据 行为 和 子 行为 概念 ， 共 享 计划 
理论 描述 了 一 个 达到 共同 目标 的 层次 化 计划 。 这 也 是 联合 意图 理论 和 共享 计划 理 
论 之 间 的 主要 区 别 ， 共 享 计 划 理 论 阐 述 了 一 种 实现 共同 目标 的 方法 ， 而 联合 意图 
理论 仅 前 述 了 这 个 共同 目标 。 然 而 ， 联 合意 图 和 联合 提议 等 缺少 理论 支持 ， 导 致 
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在 团队 合作 和 团队 行为 的 推理 上 具有 局 限 性 。 

联合 意图 和 共享 计划 这 两 种 理论 广泛 应 用 于 检验 和 阐述 合作 。 在 本 书 方法 
中 ,将 借鉴 这 两 种 方法 ， 尽 管 由 于 在 执行 过 程 中 协同 计划 和 ALICA 规划 之 间 存 
在 相似 结构 而 使 得 共享 计划 最 明显 。 


2.4 约束 规划 


约束 规划 主要 强调 对 问题 的 声明 和 描述 ， 然 后 选择 合适 的 约束 求解 器 进行 求 
解 。Rossi 等 人 "给 出 最 近 的 一 篇 综述 。Fruhwirth!% 提出 一 种 通用 框架 ， 将 约 
RAIER) (CHR) 定义 为 一 种 表示 约束 的 统一 方式 。 经 简化 后 ， 约 束 处 理 规 
则 具有 Head < = = > Guard | body 的 形式 ， 这 意味 着 如 果 某 项 约束 实施 统一 的 
Head， 以 及 没有 在 Head 中 调节 变量 的 情况 下 ，Guard 判断 为 真 ，Head 被 Body 
Pik, YARRCR MAA RM EZR ECL PS” [2] H, CHR 可 用 于 约束 传播 与 
简化 ， 然 而 需 与 搜索 算法 相 结 合 来 确定 满足 约束 满足 问题 的 解决 方案 。 这 种 搜索 
方法 通常 对 进一步 约束 的 变量 进行 假设 ,一 旦 假设 导致 可 检测 的 不 满意 约束 ， 则 
回 湖 。 回 渊 还 可 扩展 到 回 跳 ， 即 多 步 同 时 回 湖 以 对 搜索 空间 中 更 有 和 希望 的 区 域 进 
行 搜索 ”| 。 

在 布尔 域 中 的 约束 满足 已 证 明 是 一 个 完全 误解 问题 。 后 来 ， 同 样 证 明 
对 于 普通 的 约束 满足 问题 ， 在 有 限 域 中 也 是 无 解 的 “| 。 随 着 某 些 可 追溯 的 子 类 
被 确认 “” ， 很 难 满足 机 器 人 控制 ， 尤 其 是 许多 不 同 问题 需要 制定 的 需求 。 

从 机 器 人 研究 的 角度 出 发 ， 在 连续 域 上 的 问题 分 类 更 加 有 意义 ， 由 于 在 机 
器 人 领域 中 很 多 都 是 真实 值 ， 如 关节 位 置 或 角度 状态 。 通 常 ， 求 解 实数 域 基于 
约束 的 数学 模型 问题 是 不 可 确定 的 “| ， 然 而 解 可 以 近似 。 寻 找 合理 精确 度 的 
近似 解 之 间 的 误差 是 不 可 能 的 。 约 束 满足 问题 的 最 普通 的 实例 是 所 有 自由 变量 
的 一 阶 方程 ,无 解 。 且 该 问题 不 可 确定 ， 因 为 通常 一 阶 逻 辑 中 满意 度 不 可 
判定 。 

为 解决 更 复杂 的 问题 ，J6nsson 和 Frank 提出 了 动态 约束 问题 ， 其 中 单个 
约束 问题 以 序列 形式 链接 。 邻 近 问 题 可 通过 限制 或 放松 相互 得 到 。 可 提出 一 种 基 
于 过 程 的 推理 方法 来 求解 该 系统 。 因 此 ， 所 得 到 的 系统 可 有 效 解决 问题 ， 给 出 相 
应 的 过 程 。 在 该 方法 下 ， 对 求解 系统 前 所 有 变量 必须 已 知 的 条 件 放松 ， 考 虑 预先 
变量 个 数 未 知 的 问题 。 这 样 ， 无 界 规划 任务 可 表示 为 约束 满足 问题 。 同 理 ，Na- 
reyek °°! 提出 了 一 种 在 图 空间 基于 约束 的 局 部 搜索 规划 ， 其 中 每 个 图 都 表示 一 个 
可 能 的 规划 。 

最 近 ， 分 布 式 约束 最 优 问题 用 于 控制 MAS 系统 的 行为 。 该 项 目 具 体 由 
Petcu 2 负责。 在 该 系统 中 ， 每 个 智能 体 都 具有 和 控制 一 个 约束 优化 问题 ， 这 
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些 问 题 与 其 他 智能 体 的 问题 具有 某 些 共享 变量 。 通 过 交错 式 局 部 求解 和 信息 交 
换 ， 智能 体 获 得 一 个 全 局 解 。 通 常 ， 智 能 体 对 于 该 问题 都 没有 全 局 解 。 

总 之 ,约束 规划 是 一 种 非常 简洁 且 数 学 意义 清楚 的 问题 表示 方式 ， 这 也 是 将 
约束 规划 技术 集成 到 本 研究 中 的 主要 动机 。 然 而 ， 从 约束 规划 角度 下 的 软 实时 来 
看 ， 在 考虑 具有 固有 动态 性 的 这 些 域 中 的 一 类 问题 尚未 解决 。 
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现 已 有 多 种 不 同方 法 来 描述 智能 体 行为 ， 从 根据 Bratman? BDI 模型 的 
STRIPS 规划 语言 %] 和 第 一 种 推理 形式 ， 到 Dasani 等 人 5 提出 的 2APL 等 现代 语 
言 。 接 下 来 ， 将 简要 概述 这 一 广阔 领域 ， 并 讨论 与 本 书 编程 语言 相关 的 其 他 不 同 
方法 。 


3.1 行为 演算 


STRIPS 是 第 一 种 允许 智能 体 推理 其 行为 的 推理 。 尽 管 STRIPS 受 限于 仅 采 
用 命题 式 前 提 条 件 和 效果 来 描述 行为 ,但 该 方法 非常 有 效 。McCarthy 和 
Hayes”) 首先 对 此 进行 研究 ， 并 提出 了 相关 基本 问题 ， 如 框架 问题 ， 由 此 推动 
了 情境 演算 的 发 展 " 2 。 在 该 理论 基础 上 开发 了 一 系列 的 规划 语言 。 最 早 是 由 
Levesque 等 人 '*1 开 发 的 GOLOG， 随 后 产生 了 许多 改进 版 本 ， 如 允许 并 发 处 理 、 
外 源 性 行为 反应 和 中 断 的 ConGolog™™ 。 在 后 来 出 现 的 著名 的 IndiGolog'” 中 还 增 
加 了 对 规划 和 搜索 的 支持 。 

同时 ， Thielscher''®™®] 在 Holldobler 和 Schneeberger!” 的 基础 上 提出 了 第 二 种 
演算 方法 ， 即 流 演算 。 该 算法 更 侧重 于 描述 环境 的 动态 事实 ， 而 不 是 改变 环境 的 
行为 。Thielscher0 基于 流 演算 开发 了 一 个 称 为 FLUX 的 编程 框架 。FLUX 主要 
考虑 部 分 知识 的 表示 和 知识 的 更 新 。 这 些 都 是 通过 约束 来 实现 的 。 

Kowalski 和 Sergot! **! 提出 的 事件 演算 是 另 一 种 非常 有 前 景 的 方法 ， 该 方法 允 
许 以 时 间 间 隔 进行 推理 ， 而 上 述 两 种 演算 方法 都 仅 考虑 离散 状态 。 有 关 详 细 介绍 
请 参见 参考 文献 【151 ] 。 遗 憾 的 是 ， 据 我 们 所 知 ， 还 尚未 有 基于 事件 演算 的 面 
向 智能 体 的 完整 语言 。 

所 有 这 些 语言 都 侧重 于 智能 体 知识 的 表示 、 行 为 效果 以 及 如 何 根据 这 些 知 
识 进 行 推理 。 相 反 ，ALICA 则 侧重 于 旨 在 解决 特定 问题 或 处 理 特定 情况 的 策略 
的 表示 。 而 且 ，ALICA 是 一 种 以 团队 为 中 心 的 语言 ， 而 上 述 语言 通常 都 只 针对 
单个 智能 体 的 情况 。 因 此 ， 从 行为 演算 的 角度 来 看 ，ALICA 可 看 作 一 种 与 
GOLOG 或 FLUX 相 结 合 的 程序 表示 。 同 理 ， 从 ALICA 的 角度 来 看 ， 基 于 行为 
演算 的 语言 将 弥补 需要 行为 推理 的 缺陷 ， 这 是 因为 ALICA 特意 使 得 环境 表示 
更 开放 。 
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3.2 BDI 语言 


根据 Bratman’! ( 见 2.1 节 ) 提出 的 BDI 模型 开发 了 一 系列 成 功 的 智能 体 语 
言 。 而 ALICA 可 看 作 一 种 没有 显 式 表示 期 望 或 目标 的 BDI 语言 ， 这 是 由 于 其 着 
重 于 将 规划 看 作 意 图 。 接 下 来 ， 将 介绍 与 ALICA 相关 的 一 些 具有 影响 力 的 BDI 


ťa, 


HAR: 

3APL ”3APL 是 一 种 面向 智能 体 的 编程 语言 "…” ， 目 的 是 对 具有 认 知 能 力 
的 智能 体 建 模 ， 并 对 认 知 机 器 人 进行 高 层 控制 。ALICA 与 3APL 具有 很 多 相同 的 
概念 ， 如 信念 基 的 定义 和 将 目标 解释 为 “要 完成 的 目标 ”"， 这 并 不 是 声明 性 描 
述 ， 而 是 通过 一 个 朝向 实现 目标 的 规划 。 然 而 与 ALICA 不 同 的 是 ，3APL 还 便于 
明确 规范 目标 。 在 3APL 中 引入 了 规则 集 和 信念 以 允许 在 目标 和 规划 层面 上 进行 
推理 。 在 此 ，ALICA 通过 一 种 与 3APL 完全 相同 的 过 渡 系 统 方法 来 定义 其 操作 语 
义 。 实 际 上 ,在 3APL 中 ， 用 于 纯 语 言 元 素 的 过 渡 系 统 和 用 于 指定 智能 体 控制 结 
构 的 元 语言 的 过 渡 系统 是 不 同 的 。 而 在 ALICA 中 ， 并 没有 严格 区 别 ， 因 此 两 种 
过 渡 系 统 可 合并 。 尽 管 3APL 的 实现 支持 以 一 种 与 FIPASL “兼容 的 方式 进行 通 
fA, (B ALICA 所 支持 的 多 智能 体 显 式 规划 不 能 在 3APL 中 表示 。ALICA 还 可 通过 
更 具 表 现 力 的 约束 库 来 扩展 运行 时 替换 的 概念 ， 这 是 3APL 中 智能 体 配置 的 一 
部 分 。 

2APL 在 3APL 之 后 ，Dastani 等 人 55 提出 了 2APL， 其 具有 如 异常 处 理 、 
修复 机 制 和 语言 接口 等 特点 的 各 种 编程 结构 。 然 而 ，2APL 没有 从 全 局 角度 对 多 
智能 体 规 划 建 模 的 特点 。 实 际 上 ， 需 要 设计 单个 智能 体 的 规划 以 使 得 其 可 与 其 他 
智能 体 通过 显 式 消 息 进 行 交 互 。 

AgentSpeak(L) AgentSpeak ( L) 允许 类 似 于 逻辑 程序 来 指定 BDI 智能 
体 "”。Rao 确定 了 BDI 系统 实现 与 理论 之 间 的 差别 8$， 并 试图 通过 引入 抽象 
BDI 系统 实现 的 AgentSpeak(L) 来 克服 上 述 问题 。AgentSpeak(L) 是 一 种 基于 事 
件 和 行为 的 受 限 一 阶 语言 的 编程 语言 。 但 遗憾 的 是 ，AgentSpeak(L) 不 适用 于 多 
智能 体 规划 建 模 。 值 得 注意 的 是 ，AgentSpeak(L) 可 由 3APL RUDE, FRA 
Hpo, 

KARO KARO 5 42 — Ft Sa Ea, M E — PPE oy AS ie AY AE AG 
辑 。 然 而 Hindriks 和 Meyer ™ 提出 一 种 直接 与 逻辑 相关 的 编程 语言 。 在 此 ， 认 为 


O 智能 实体 智能 体 基础 。 
© Wooldridge!'*") 也 独立 确定 了 同样 的 语义 问题 。 
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动态 逻辑 的 方式 仅 限于 在 行为 并 发 且 延 续 一 定时 间 间 隔 的 机 器 人 领域 中 使 用 。 由 
此 ,机 融 人 场景 可 能 更 容易 描述 与 时 间 间 隔 有 关 的 理论 ， 如 上 述 的 事件 
演算 "| 。 


3.3 ”规划 执行 语言 


从 更 实际 的 动机 来 看 ， 规 划 执行 语言 并 不 是 按照 一 个 理性 智能 体 的 方法 ， 而 
通常 是 提供 一 个 规划 的 执行 层 以 及 指定 该 执行 层 的 语言 。 而 这 也 是 ALICA 的 目 
的 所 在 ， 通 常 在 BDI 语言 的 某 种 意义 上 ， 并 没有 提供 修复 失败 规划 的 多 种 手段 。 
另外 ， 也 没有 像 ALICA 和 STEAM 语言 那样 与 合作 紧密 集成 "i ( 见 3.4 节 )。 

PLEXIL ”最 著名 的 规划 执行 语言 之 一 是 NASA 的 PLEXIL'”! 。PLEXIL 完全 
面向 于 确定 性 执行 ， 并 在 其 主要 领域 得 到 良好 应 用 ， 即 半 自 主 空间 飞行 器 ， 如 卫 
星 。 将 任务 看 作 一 种 树 形 结构 并 提供 同步 执行 语义 。 树 中 所 有 节点 都 并 行 执行 ， 
并 通过 共享 变量 进行 通信 。PLEXIL 并 不 提供 任何 多 智能 体 语义 ， 其 细 粒 度 的 编 
程 语 言 可 分 配 变 量 并 调用 函数 库 。 相 比 而 言 ，ALICA 中 的 最 小 执行 元 素 是 行为 ， 
这 本 质 上 是 图 灵 完 全 的 程序 。 

SMACH ”属于 规划 执行 语言 范畴 的 另 一 种 著名 框架 是 Bohren 和 Cousins!’ 
等 人 提出 的 SMACH， 这 是 一 种 在 ROS 中 的 任务 级 合作 和 执行 的 库 "' ”i。 将 其 作 
为 一 种 高 层 规划 系统 和 底层 行为 原 语 〈 基 元 ) 之 间 的 中 间 层 任务 执行 。 尽 管 
SMACH 也 支持 其 他 执行 策略 ， 但 主要 还 是 支持 层次 状态 机 。 

SMACH 所 采用 的 实际 内 部 结构 ， 即 允许 在 ROS 框架 中 并 发 和 服务 调用 的 层 
次 状态 机 ， 使 得 SMACH 是 在 所 有 讨论 的 语言 中 与 ALICA 程序 内 部 结构 最 相似 的 
语言 。 然 而 ，SMACH 仅 针 对 个 体 机 器 人 ， 并 在 单个 系统 中 各 元 素 之 间 提 供 协 调 
隐喻 。 一 方面 ，ALICA 主要 针对 机 器 人 团队 ， 提 供 一 组 层次 化 的 状态 机 。 另 一 
方面 ，ALICA 通过 效用 函数 和 基于 约束 的 团队 行为 建 模 来 进行 任务 分 配 。 

XABSL XABSL 语言 是 由 Litzsch 等 人 '” 提出 的 一 种 可 作为 规划 执行 语言 
的 行为 建 模 方法 。XABSL 语言 通过 状态 和 选项 的 层次 化 结构 来 描述 智能 体 行为 。 
Zweigle 4E AU 将 类 似 于 Petri 网 的 结构 扩展 到 分 析 多 智能 体 之 间 的 交互 。 图 形 
化 建 模 的 XPIM 网 已 编译 到 XABSL 树 中 。 尽 管 ALICA 中 也 是 以 层次 化 交互 网 络 
的 总 体 思路 为 主 ， 但 与 XPIM 网 存在 根本 不 同 。 最 主要 的 是 ，ALICA 通过 其 能 力 
来 描述 智能 体 ， 并 通过 角色 和 任务 来 实现 规划 和 智能 体 之 间 的 一 个 两 层 抽象 ， 这 
样 就 易于 定义 依赖 于 所 涉及 智能 体 异 构 能 力 的 复杂 合作 规划 。 而 且 对 任务 分 配 和 
HR, ALICA 将 基于 状态 的 行为 描述 与 效用 函数 相 结 合 。 前 者 可 实现 高 度 动态 
下 仍 保持 稳定 的 自 适 应 团队 行为 ， 而 后 者 以 部 分 一 阶 逻 辑 来 扩展 该 语言 ， 使 之 可 
表示 实数 范围 内 的 复杂 关系 。 因 此 ，ALICA 比 简单 的 基于 状态 的 层次 化 方法 性 
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能 更 优 。 
3.4 团队 合作 


根据 2. 3 节 中 介绍 的 联合 意图 和 共享 规划 等 团队 合作 理论 ,产生 了 多 种 实现 
方法 。 在 此 ， 简 要 重点 介绍 其 中 最 主要 的 几 种 。 

GRATE” Jennings 等 人 提出 的 CRATE” 系统 基于 联合 意图 理论 。 通 过 共同 
责任 的 概念 ，GRATE * 提供 了 一 种 基于 规则 的 建 模 方法 来 实现 合作 ， 而 共同 责任 
的 思想 也 是 基于 联合 意图 理论 的 。 然 而 GRATE” 主要 面向 智能 体 及 其 之 间 的 通信 
均 可 靠 的 工业 设备 ， 这 样 就 利用 核心 概念 来 组 织 构建 联合 行为 ， 并 在 执行 相应 动 
作 之 前 采用 广泛 的 通信 协议 。 

STEAM STEAM (Shell for Teamwork)'"' "1 是 建立 在 联合 意图 理论 和 共享 
规划 理论 基础 上 并 试图 克服 其 缺点 的 。 基 于 联合 意图 ，STEAM 建立 与 第 2 章 介 
绍 的 共享 规划 理论 平行 的 层次 结构 。 因 此 ，STEAM 方法 通过 建立 和 维持 联合 意 
图 来 实现 ， 并 利用 共享 规划 在 复杂 任务 中 形成 团队 意图 。 

ALICA 与 STEAM 非常 相似 ， 并 借鉴 了 其 中 某 些 思想 ， 同 时 还 借鉴 了 联合 意 
图 理论 和 共享 规划 理论 。 正 如 STEAM, ALICA 构建 了 涵盖 整个 团队 及 其 子 团队 
的 协作 行为 的 团队 规划 层次 结构 ， 并 提供 了 团队 智能 体 的 分 配 机 制 ， 来 确定 团队 
成 员 执行 跟踪 动作 的 需要 。ALICA 还 借鉴 了 联合 意图 理论 ， 尤 其 是 在 同步 操作 
定义 中 〈 见 5. 13 4) 和 在 需要 通信 故障 时 。 然 而 在 ALICA 中 ， 通 信 故 障 是 在 周 
期 性 消息 中 隐 式 表现 的 ( 见 7.5 节 )。 

与 STEAM 相 比 ，ALICA 智能 体 通 常 在 执行 合作 目标 之 前 无 需 建立 联合 意 
图 。 实 际 上 ， 每 个 智能 体 对 队友 决策 进行 估计 并 根据 这 些 估 计 进 行 相应 动作 。 检 
测 个 体 决策 之 间 的 冲突 并 利用 团队 成 员 内 部 状态 间 的 周期 性 通信 来 解决 冲突 。 尽 
E STEAM 提供 了 选择 性 通信 以 及 跟踪 团队 成 员 意 图 的 方法 ,但 本 书 认为 对 于 高 
动态 域 和 时 序 要 求 严格 的 应 用 ， 在 联合 行为 开始 之 前 应 忽略 建立 或 估计 共同 承诺 
的 严格 要 求 。 在 ALICA 中 ， 智 能 体 不 断 进行 决策 和 行为 直到 产生 相互 矛盾 的 信 
息 ， 这 样 似乎 更 适用 于 这 种 应 用 。 而 且 ，ALICA 提供 了 相关 的 语言 元 素来 强制 
执行 一 个 明确 约定 ， 由 此 对 需要 时 间 严 格 同步 的 行为 产生 联合 意图 ， 如 合作 搬运 
一 个 物体 。 另 外 ,由 STEAM 实现 的 团队 智能 体 分 配 以 及 操作 者 对 团队 的 分 配 
(对 实际 团队 行为 进行 封装 ) 对 高 动态 域 而 言 过 于 固定 。 例 如 在 机 器 人 足球 比赛 
中 ， 若 一 个 作为 防守 队员 的 机 器 人 控制 着 球 且 比赛 现场 情况 允许 的 话 ， 该 机 器 人 
也 应 能 承担 进攻 队员 的 任务 。 为 便于 实现 这 种 行为 ， 在 此 提供 了 一 种 略 显 不 同 的 
角色 定义 ， 并 结合 任务 以 及 任务 偏好 的 概念 。 与 STEAM 不 同 ，ALICA 不 依赖 于 
团队 领导 者 ， 而 STEAM 对 不 同 目的 假设 一 个 团队 领导 者 。 实 际 上 ，ALICA 只 有 
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在 检测 到 一 个 长 期 冲突 时 才 恢 复 为 基于 领导 者 的 决策 。 由 此 ， 实 现在 运行 期 间 切 
换 合 作协 议 。 

项 目 “Machinetta” 就 是 基于 STEAM 实现 的 "I 。 为 提供 一 种 团队 合作 框架 
的 轻巧 便捷 实现 方法 ，Machinetta 采用 代理 概念 来 构建 一 个 团队 合作 封装 模型 的 
可 重用 软件 包 。 每 个 代理 都 与 单个 域 智能 体 紧 密 配 合 ， 来 表示 团队 中 的 智能 体 。 

STEAM 只 是 在 合作 理论 与 实践 之 间 搭 建 了 桥梁 ， 而 并 不 是 一 个 机 器 人 团队 
的 完整 实现 。STEAM 提供 了 一 种 推理 或 建立 团队 合作 的 机 制 ， 但 没有 详细 描述 
规划 或 操作 者 的 内 部 关系 。STEAM 及 其 实现 TEAMCORE 仅 假设 反应 或 本 地 
规划 ， 并 不 支持 顺序 和 /或 并 行 行为 的 实际 “程序 ”规划 ， 同 时 也 并 没有 真正 指 
定 一 个 智能 体 的 内 部 控制 周期 。 在 这 方面 ， 智 能 体 编 程 语言 对 ALICA 的 设计 有 
所 启发 ， 尤 其 显著 的 是 3APL'" 和 2APL 5 。 随 后 ，Tambe 等 人 定义 了 一 个 基于 
TEAMCORE 的 面向 团队 的 编程 框架 "“ 。 在 此 ， 单 个 智能 体 通过 TEAMCORE 代 
理 在 不 同 编程 语言 中 实现 合作 。 该 方法 本 身 很 好 地 实现 了 一 定 距 离 内 异 构 可 编程 
智能 体 之 间 的 协调 合作 ,但 是 并 没有 进一步 解决 团队 机 器 人 所 面临 的 动态 域 
问题 。 

CAST  CAST''*'*! (Collaborative Agents for Simulating Teamwork) 是 一 种 基 
于 共享 规划 理论 的 团队 合作 框架 。CAST 侧重 于 动态 环境 的 灵活 性 并 通过 预测 团 
队 成 员 需 要 何 种 信息 来 进行 主动 信息 交换 。 其 中 ， 利 用 Petri 网 来 表示 团队 结构 
以 及 团队 合作 过 程 ， 即 将 要 执行 的 规划 。 这 种 表示 方式 避免 了 信任 推理 的 计算 复 
杂 性 ， 与 ALICA 中 所 用 的 有 限 状 态 机 非常 相似 。 另 外 ，CAST 中 所 采用 的 动态 角 
色 选 择 也 与 5. 13 节 中 将 要 讨论 的 动态 任务 分 配 规则 非常 相似 。 

然而 ， 相 比 于 ALICA 中 基于 智能 体 、 角 色 和 任务 的 两 层 抽 象 ，CAST 中 对 角 
色 表 示 的 表现 力 较 差 。 另 外 ， 当 团队 成 员 失效 时 ，CAST 无 法 对 其 进行 补偿 。 最 
后 ， 在 参与 任务 完成 的 智能 体 个 数 有 界 (XOR 运算 符 ) 的 情况 下 ，CAST 需要 在 
执行 动作 之 前 先进 行 通 信 。 

ALLIANCE “Parker02 提出 的 ALLIANCE 哥 构 旨 在 提高 移动 机 器 人 团队 合 
作 的 容错 性 。 建 立 一 个 机 器 人 的 合作 框架 ， 并 在 没有 任何 集中 控制 下 自 适 应 故 
障 。 类 似 于 ALICA, ALLIANCE 依靠 周期 性 广播 通信 来 实现 该 目标 。 与 ALICA 
不 同 的 是 ，ALLIANCE 不 具有 可 表示 复杂 协调 行为 的 面向 团队 的 高 层 规划 。 实 
际 上 ，ALLIANCE 定义 了 一 组 行为 ， 当 其 他 行为 休眠 时 ， 执 行 某 个 行为 。 根 据 
急躁 和 默许 变量 值 的 概念 ， 机 器 人 动态 选择 合适 的 行为 集 。 每 组 行为 由 与 其 他 
组 动机 行为 相互 关联 的 动机 行为 控制 。 尽 管 该 方法 可 适应 动态 变化 的 情况 ,但 
从 该 建 模 角度 而 言 ， 其 本 身 并 不 适合 于 具有 大 量 因 果 和 时 间 依 赖 关系 的 复杂 规 
划 。 尤 其 是 ， 将 规划 算法 产生 的 局 部 有 序 规划 转化 为 似乎 不 可 行 的 相应 ALLI- 
ANCE 程序 。 
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在 处 理 在 一 个 具有 噪声 以 及 可 能 存在 竞争 对 手 的 实时 动态 环境 下 的 合作 问 
题 时 ，Reis 等 人 ”确定 了 反应 与 合作 之 间 的 权衡 关系 。 为 解决 上 述 平衡 ， 提 
出 通过 引入 一 个 扁平 层次 结构 来 区 分 称 为 策略 的 情况 和 反应 的 情况 。 在 某 种 意 
XE, ALICA 通过 允许 任意 深层 伦 套 的 规划 对 此 进行 扩展 ， 以 使 得 在 每 层 可 利 
用 阀 值 单独 调节 反应 程度 ， 并 对 任务 重 分 配 进行 相似 性 度量 〈 见 5.8 节 )。 男 
Sp, Reis 等 人 还 区 分 了 位 置 和 角色 的 不 同 。 位 置 表示 一 个 智能 体 在 队列 中 的 实 
际 位 置 ， 而 角色 决定 了 智能 体 的 行为 。 该 方法 已 成 功 应 用 于 机 器 人 足球 仿真 比 
赛 中 。 

然而 ， 上 述 所 采用 的 角色 交换 算法 DPRE (Dynamic Positioning and Role 
Exchange， 动 态 位 置 和 角色 交换 ) 仅 允 许 两 个 智能 体 之 间 的 角色 交换 ， 并 没有 考 
虑 一 个 全 新 的 分 配 。 由 于 DPRE 在 决定 是 否 与 其 他 智能 体 角色 交换 时 采用 潜在 效 
用 增益 ， 两 个 角色 切换 产生 冲突 以 及 相应 的 效用 测量 相互 关联 时 ， 并 不 清楚 会 发 
生 什 么 情况 。 另 外 ， 由 于 该 方法 认为 所 有 智能 体 均 同 构 ， 并 将 队 形 和 位 置 紧密 集 
成 到 框架 中 ， 因 此 无 法 很 好 地 应 用 到 机 器 人 足球 领域 。 最 后 ， 该 方法 不 提供 任何 
规划 的 内 部 结构 ， 除 了 角色 交换 之 外 也 没有 任何 修复 机 制 。 

在 此 讨论 的 团队 合作 方法 都 没有 通过 约束 满足 和 优化 问题 对 行为 进行 建 模 。 
据 我 们 所 知 ，ALICA 是 机 器 人 领域 团队 合作 的 第 一 个 完整 框架 ， 其 中 ， 该 声明 
描述 可 作为 一 个 完全 集成 的 语言 元 素 。 由 于 ALICA 解决 运行 期 间 动 态 形成 的 问 
题 ， 鲁 棒 地 协调 团队 中 的 解决 方案 ， 并 在 必要 情况 下 利用 团队 的 整体 计算 能 力 来 
解决 难题 ， 因 此 这 是 ALICA 对 团队 合作 方法 最 重要 的 贡献 。 


3.5 任务 和 角色 分 配 


关于 任务 和 角色 分 配 ， 目 前 已 有 广泛 研究 ， 无 论 以 何 种 方式 来 讨论 这 些 方法 
都 已 超出 本 书 范畴 。 近 来 ，Campbell 和 Wu 给 出 了 精心 研究 的 综述 文献 。 
Gerkey' ”对 任务 分 配 中 的 不 同 问题 进行 了 分 类 ， 从 而 也 对 角色 分 配 算法 进行 了 
分 类 。 之 后 ， 对 不 同 任务 分 配 问 题 建立 了 一 套 分 类 系统 。 大 体 上 ， 根 据 三 种 特性 
来 对 多 机 器 人 的 任务 分 配 进行 分 类 : 

单 任务 机 器 人 〈ST) 和 多 任务 机 器 人 (MT): 表示 一 个 机 器 人 是 否 可 以 同 
时 执行 多 个 任务 。 在 ALICA 中 ， 任 务 分 配 问题 假设 是 单 任务 机 器 人 ， 然 而 由 于 
ALICA 程序 的 层次 特性 ， 实 际 上 机 器 人 或 团队 机 器 人 可 并 行 执行 不 同 规划 ， 
此 ALICA 中 所 反映 的 全 局 问题 可 由 多 任务 机 器 人 处 理 。 类 似 于 Gerkey 的 假设 ， 
在 多 任务 机 器 人 情况 下 ， 决 策 相 关 的 实体 ， 如 效用 和 前 提 条 件 都 必须 独立 无 关 。 

单机 器 人 任务 (SR) 和 多 机 器 人 任务 (MR): 表示 一 个 任务 仅 需要 一 个 机 
器 人 还 是 多 个 机 器 人 。ALICA 中 的 基数 用 于 表示 在 特定 背景 下 执行 每 个 任务 所 
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需 的 机 避 人 个 数 ， 由 此 可 描述 一 个 多 机 右 人 任务 问题 ， 并 由 于 基数 可 被 看 作 时 间 
间隔 ， 因 此 某 些 任务 ,其 至 某 些 机 器 人 都 是 可 选 的 。 

瞬时 分 配 (IA) 和 延 时 分 配 (TA): 表示 是 否 需 要 考虑 规划 今后 的 任务 ， 
或 对 于 未 来 可 能 的 任务 没有 更 多 信息 。 由 于 环境 的 动态 性 ， 通 常 ALICA 用 于 处 
理 瞬 时 分 配 。 然 而 原则 上 ，ALICA 中 用 于 估计 任务 分 配 的 效用 函数 可 与 任何 信 
息 相 结合 ， 如 未 来 可 能 的 分 配 。 

Gerkey 表明 ST-SR-IA 问题 可 将 其 看 作 最 优 分 配 问题 来 处 理 ” 。 另 外 ， 还 
表明 与 本 书 工作 最 相关 的 ST- MR-IA 问题 以 及 MT- MR-IA 问题 都 是 NP 问题 (SE 
确定 性 多 项 式 问 题 )。Nair 等 人 表明 ， 在 考虑 未 来 分 配 时 ， 寻 找 一 个 最 优 分 配 的 
问题 是 NEXP- complete 问题 。 

在 上 述 工作 中 ， 都 主张 通过 引入 角色 选择 和 和 角色 执行 动作 并 采用 POMDP 
(Partially Observable Markov Decision Processes ， 部 分 可 观测 的 马尔 科 夫 决策 过 程 ) 
对 角色 分 配 进 行 建 模 。 如 果 具 有 必要 的 概率 估计 并 应 用 MDP 假设 ,该 方法 可 产 
生 最 优 决策 。ALICA 以 一 种 更 为 通用 的 方式 来 使 用 效用 函数 。 在 没有 概率 估计 
或 正确 的 马尔 科 夫 模型 情况 下 ， 这 可 表示 决策 理论 实体 (如 POMDP) 或 更 简单 
的 启发 式 估 计 。 

Lerman 等 人 ” 对 动态 任务 分 配 问题 进行 了 深入 研究 ， 其 中 机 器 人 需要 不 断 
重新 评估 其 决策 ， 并 重新 分 配 到 其 他 任务 中 来 适应 新 的 情况 。 他 们 主张 采用 一 种 
数学 模型 来 分 析 特 定 的 多 机 器 人 系统 ， 这 类 似 于 大 量 参 数 集 下 广义 仿真 的 思想 ， 
然而 这 种 模型 并 不 能 用 于 处 理由 具有 传感器 噪声 的 异 构 机 器 人 组 成 并 同时 处 理 许 
多 不 同 环境 信息 的 实际 机 器 人 团队 系统 。 

当然 ， 任 务 分 配 问题 也 可 通过 机 器 人 足球 比赛 来 解决 。Vail 和 Veloso'” 提 
出 了 一 种 类 似 于 ALICA 中 任务 分 配 的 方法 ， 其 中 机 器 人 根据 共享 信息 局 部 计算 
任务 分 配 结果 ， 并 按照 该 结果 进行 动作 。 然 而 这 种 任务 分 配 算法 要 处 理 有 序列 表 
中 的 全 部 任务 ， 并 对 每 个 任务 分 配 一 个 具有 最 高 效用 函数 的 机 器 人 。 通 过 以 一 个 
合适 的 效用 函数 对 所 有 任务 进行 排序 ， 该 过 程 可 舱 入 到 ALICA 的 任务 分 配 中 。 
另外 ， 为 保持 团队 中 的 任务 稳定 ， 还 指定 了 一 个 任务 重新 分 配 的 最 小 时 间 间 隔 。 
该 时 间 间 隔 一 般 为 几 秒 的 数量 级 。 在 ALICA 中 ， 为 执行 重新 分 配 ， 需 指定 一 个 
大 于 效用 偏差 的 国 值 。 另 外 ， 利 用 一 个 相似 性 度量 来 区 分 变化 很 小 的 重新 分 配 
(如 交换 两 个 机 器 人 的 任务 ) 以 及 改变 整个 分 配 的 重新 分 配 。 

Weigel 等 人 "利用 效用 函数 进行 动态 角色 分 配 ， 即 测量 与 其 他 机 器 人 独立 
的 每 个 机 器 人 一 角色 对 的 效用 ， 由 此 创建 一 个 鲁 棒 且 高 效 的 角色 分 配 算法 ， 然 而 
该 方法 局 限于 独立 的 效用 测量 并 仅 针对 单 任 务 单机 器 人 情况 。 

机 器 人 足球 比赛 中 的 其 他 合作 和 分 配方 法 经 常 采 用 一 个 集中 模块 来 进行 某 些 
决策 。 例 如 ，Lau EA 采用 一 种 分 布 式 的 角色 分 配 ， 但 集中 计算 位 置 分 配 。 
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对 于 上 述 问题 ，Lau 等 人 实质 上 是 采用 了 一 个 结合 优先 级 列表 的 贪 禁 算 法 。 

Wang A ”提出 了 另 一 种 算法 ， 其 中 机 器 人 根据 少数 者 博弈 模型 切换 到 
最 少 表示 的 角色 '” 。 由 此 ， 可 根据 之 前 选择 的 结果 来 动态 适应 角色 选择 策略 。 
该 研究 成 果 具 有 广阔 前 景 ,但 产生 的 性 能 有 赖 于 所 考虑 历史 的 长 度 ， 并 且 算 法 空 
间 复 杂 度 与 历史 步 长 成 指数 关系 。 


3.6 评估 协议 和 冲突 消解 


如 果 没 有 进行 通信 ，STEAM 可 推理 通信 成 本 与 协调 质量 风险 之 比 ” ， 然 后 
提供 维护 和 保持 团队 合作 所 需 的 修复 运算 符 。 尽 管 这 种 方法 很 有 吸引 力 ， 但 在 大 
多 数 实际 应 用 中 ， 该 方法 所 需 的 确定 通信 成 本 和 失败 风险 的 必要 参数 不 能 事先 准 
确 确定 。 实 际 上 ， 只 能 进行 大 致 估计 。 

还 可 利用 规划 识别 来 检测 ， 然 后 修复 团队 合作 中 产生 的 冲突 ， 正 如 Kaminka 
和 Tambe 通过 采用 社会 周至 监测 (Socially attentive monitoring) 来 实现 。 可 利 
用 规划 识别 来 扩充 本 书 所 提 方 法 ， 而 且 可 能 会 提高 整体 性 能 ， 但 这 已 超出 本 书 
范畴 。 

Kaminka 和 Frenkel ”提出 的 BDI 架构 的 BITE 可 允许 同步 动作 以 及 对 任务 分 
配 建 模 ， 这 与 本 书 所 提 方 法 相似 。BITE 为 所 有 问题 都 提供 可 互 换 的 决策 协议 ， 
以 使 得 设计 者 可 对 每 个 特定 问题 选择 最 佳 协议 。 以 类 似 的 方式 ，ALICA 可 允许 
通过 条 件 的 弱 同 步 ， 或 通过 同步 元 素 实 现 更 多 通信 的 增强 同步 〈 见 5.13 节 )。 
另外 ， 当 检测 到 持续 冲突 时 ，ALICA 可 自动 切换 任务 分 配 的 决策 协议 〈 见 第 6 
章 ) 。 而 BITE 不 支持 决策 协议 间 的 自动 切换 ， 而 且 在 所 有 情况 下 ，BITE 都 要 在 
行动 之 前 建立 通信 协议 ， 而 ALICA 会 在 通信 之 前 就 动作 ， 因 此 ALICA 更 注重 动 
态 环境 下 的 反应 。 在 ALICA 中 的 重要 假设 是 情况 的 变化 会 比 信息 交换 更 快 ， 因 
此 及 时 动作 至 关 重 要 。 

最 后 ， 与 上 述 讨论 的 所 有 方法 不 同 的 是 ，ALICA 还 支持 由 实 值 变量 下 的 约 
束 系统 进行 团队 行为 建 模 并 提供 一 种 机 制 来 协调 感知 较 弱 情况 下 的 结果 。 即 由 于 
所 假设 的 环境 动态 性 ， 协 作 并 不 是 要 准确 达到 R" 中 的 同一 矢量 ,而 是 通过 协作 
来 建立 一 种 接近 相似 值 的 趋势 。 协 作 方 法 将 在 10. 3 节 中 详细 讨论 。 


3.7 任务 模型 
根据 将 复杂 任务 分 解 为 较 小 任务 来 简化 原始 问题 的 思想 引出 了 层次 化 任务 网 


(Hierarchical Task Networks, HTN) 的 研究 中 。HTN 已 广泛 用 于 规划 算法 ， 
根据 动作 分 解 运算 符 ， 将 高 层 任务 逐步 分 解 为 细 粒 度 结构 。 这 种 规划 步骤 的 结果 
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可 表示 为 一 种 ALICA 规划 结构 。 

后 来 ，HTN 原始 结构 又 启发 了 TAEMS 模型 (任务 分 析 、 环 境 建 模 和 仿真 ) 
的 产生 "i 。TAEMS 是 一 种 非常 丰富 的 多 智能 体 任务 模型 ， 其 中 每 个 任务 都 有 一 
个 完成 期 限 ， 并 且 还 可 表示 任务 间 各 种 不 同 的 相互 关系 。 最 重要 的 是 ，TAEMS 
采用 分 布 式 目标 树 来 表示 智能 体 的 行为 ， 与 ALICA 不 同 的 是 ， 没 有 假定 常用 的 
程序 体系 结构 。 实 际 上 ， 智 能 体 在 运行 期 间或 许可 发 现 与 其 他 树 的 相互 关系 。 在 
这 方面 ， 与 TAEMS 相 比 ，ALICA 更 类 似 于 STEAM ， 因 为 都 假定 了 一 个 常用 的 程 
序 体系 结构 。 而 且 与 TAEMS 中 任务 间 的 各 种 相互 关系 不 同 ，ALICA 利用 有 限 状 
态 机 并 支持 状态 机 之 间 的 相互 关系 ， 如 允许 转移 到 其 他 状态 机 中 其 他 智能 体 所 处 
的 状态 。 由 此 ，ALICA 比 TAEMS 具有 更 多 的 操作 姿态 。 随 后 ，TEAMS 利用 通用 
部 分 全 局 规划 (GPGP) 进行 扩展 ” ， 产 生 一 个 面向 规划 的 方法 ， 主 要 侧重 于 分 
布 式 环境 中 并 发 任务 的 调度 。 


3.8 基于 约束 的 建 模 


Chalmers 和 Gray ”表明 如 何 将 BDI 慎 思 理解 为 约束 求解 问题 。FLUX ”以 
部 分 接地 项 (partially grounded term) 的 形式 来 表示 部 分 知识 ， 其 中 约束 表示 其 
余额 外 知识 。 

Ooi 和 Ghose 实现 了 智能 体 描述 中 的 第 一 个 约束 集成 。 后 来 Dasgupta 和 
Ghose'” 对 此 进行 扩展 ， 该 方法 可 集成 智能 体 要 优化 的 目标 。 这 些 方法 都 基于 
BDI 语言 AgentSpeak (LL) 。 

上 述 工 作 表明 在 高 层 智能 体 描述 语言 中 的 集成 约束 可 极 大 提高 效率 和 表现 
力 ， 然 而 在 Ooi 和 Ghose | 的 工作 中 ， 约束 只 能 用 于 选择 或 产生 基于 意图 的 规 
划 。 而 本 书 对 动作 或 行为 参数 进行 约束 ， 由 此 可 利用 约束 以 一 种 更 具体 和 直接 的 
方式 来 描述 行为 。 

相对 于 这 些 对 AgentSpeak(L) 的 扩展 ， 本 书 方法 从 全 局 角度 对 多 机 器 人 团 
队 进 行 约束 建 模 ， 人 允许 约束 问题 的 层次 化 分 解 ， 由 此 更 易于 对 单个 智能 体 的 子 
问题 进行 求解 ， 在 此 假设 约束 动态 改变 ， 并 在 求解 过 程 中 集成 了 合作 〈 见 第 8 
章 ) 。 

De Schutter 等 人 ”提出 了 一 种 对 个 体 机 器 人 特定 复杂 任务 进行 建 模 的 通用 
方法 ， 这 需要 在 运行 期 间 采 用 控制 器 结构 。 这 些 工作 都 主要 侧重 于 控制 ， 而 本 书 
提出 了 一 种 无 需 控 制 模型 的 通用 的 非 线 性 约束 。 在 ALICA 中 ， 有 具体 的 控制 器 由 
执行 行为 定义 。 

在 参考 文献 [38] 中 ,约束 仍 局 限于 控制 器 输出 和 关节 坐标 的 等 效 约束 。 
后 来 ，Decré 等 人 ”对 所 得 框架 进行 扩展 ， 使 得 约束 问题 更 加 明确 。 该 框架 适用 
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于 具体 问题 的 目标 函数 和 包括 不 等 式 的 约束 。 另 外 ， 还 增加 了 非 瞬 时 约束 ， 即 随 
时 间 变 化 的 约束 。 然 而 问题 类 仍 存在 凸 集 ， 且 不 能 支持 非 线性 约束 的 任意 布尔 组 
合 。iTasc 和 ALICA 中 基于 约束 的 控制 的 根本 差别 在 于 iTasc 的 控制 器 只 能 在 违 
反 约束 时 作出 反应 ， 而 在 ALICA 中 ， 采 用 控制 器 之 前 就 已 对 约束 进行 了 求解 。 
因此 ，ALICA 的 求解 时 间 可 能 会 比 iTase 更 长 ， 但 是 可 从 全 局 角度 来 考虑 控制 
任务 。 


第 2 部 分 命题 式 ALICA 


第 4 章 语 法 


本 章 将 逐步 介绍 一 种 命题 式 ALICA ( 记 为 pALICA) 的 语法 元 素 。 第 5 章 将 
介绍 相应 的 语义 。 在 第 8 章 ， 将 该 基本 语言 扩展 到 一 阶 情况 。 直 观 上 看 ， 该 基本 
问题 可 非常 简洁 地 表示 为 一 组 智能 体 需要 以 一 种 协调 一 致 的 方式 朝 着 一 个 共同 目 
标 采取 行动 。 为 实现 该 目标 ， 团 队 应 遵循 一 组 确定 行为 过 程 的 指令 ， 此 时 需要 不 
断 监 视 团 队 的 行为 进展 来 检测 和 避免 可 能 存在 的 缺陷 或 对 已 经 发 生 的 问题 进行 
补偿 。 

由 目标 描述 推导 出 一 组 指令 集 的 过 程 称 为 规划 ， 然 而 规划 并 不 是 本 书 的 重 
点 。 实 际 上 ， 是 要 设计 一 种 可 制定 指令 集 的 语言 。 另 外 ， 还 要 考虑 这 些 指令 的 有 
效 性 以 及 协调 执行 。 

例如 由 两 个 机 器 人 组 装 一 台 小 型 结构 的 情况 。 规 划算 法 将 计算 一 组 机 器 人 以 
抓 取 部 件 、 运 动 并 将 部 件 安装 到 结构 上 的 顺序 来 执行 的 指令 集 。 该 语言 可 允许 规 
划 者 表示 必要 的 概念 ， 如 行为 动作 之 间 的 时 间 和 因果 依赖 关系 。 例 如 ， 如 果 机 器 
人 有 a 负责 组 装 部 件 p， 则 机 器 人 b 可 能 需要 等 待 该 动作 完成 ， 这 样 才能 组 装 与 p 
相关 的 其 他 部 件 。 每 个 机 器 人 的 执行 层 对 这 些 指令 解释 并 执行 。 同 时 ， 不 断 监 视 
行为 进展 情况 ， 并 在 上 一 个 动作 成 功 完 成 后 调用 每 个 个 体 动作 。 另 外 ， 还 应 对 失 
败 作 出 反应 和 补偿 ， 例 如 机 器 人 没有 成 功 抓 取 一 个 部 件 ， 或 甚至 某 个 机 器 人 完全 
失效 。 最 后 ， 还 需 处 理 必 要 的 通信 和 协调 ， 这 样 才能 使 每 个 机 器 人 了 解 各 自 的 
进度 。 

可 自主 行为 的 智能 体 在 处 理 时 具有 一 组 特定 的 基本 动作 。 编 程 语言 应 能 在 任 
何 环境 下 的 每 个 时 间 点 确认 各 个 智能 体 所 采取 的 正确 动作 。 为 达到 该 目的 ， 需 要 
一 种 关于 环境 和 条 件 的 信念 (belief) 表示 方法 。 假 设 已 具有 足够 的 逻辑 人 在 语 
言 C(Pred，Func) 中 表示 上 述 条 件 。 尽 管 假设 了 一 组 谓词 Pred 和 一 组 函数 符号 
Func, 但 在 该 语言 中 不 需要 ， 这样 LC 具有 某 种 一 阶 的 意味 。 然 而 ,，L 完 全 可 以 编 
译 到 命题 式 逻 辑 中 。 

另外 ， 为 描述 场景 中 的 特定 智能 体 ， 将 包含 所 有 可 能 在 团队 中 参与 的 智能 体 记 
为 集合 4。L 和 A 这 两 个 实体 构成 一 个 pALICA 程序 的 域 签名 (domain signature) 。 
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定义 4.1 一 个 pALICA 程序 的 域 签名 (A, L) 包括 : 

e 构成 合作 团队 的 智能 体 集合 A; 

e 描述 具有 一 组 谓词 Pred 和 一 组 函数 符号 Fune 的 智能 体 信 念 基 的 语言 
L( Pred, Func) 中 的 逻辑 Lo 

用 Fe 表示 忆 中 定理 证 明 演 算 及 其 相应 算法 ， 即 Fic 表示 从 一 组 公式 大 中 推 
SPER 由 的 算法 Fec。 在 第 8 章 中 ,将 该 基本 语言 进行 扩展 以 集成 约束 满足 
问题 ， 并 更 详细 地 讨论 了 相应 算法 。 在 此 ,假设 已 具备 的 证 明 算法 。 如 果 逻 辑 
清楚 ， 就 省 略 之 而 仅 记 为 -。 在 命题 式 ALICA (pALICA) 中 ,没有 使 用 可 能 具有 
自由 变量 的 公式 。 用 Ls 表示 C(Pred, Func) 的 结果 集 。 因 此 ， 类 似 于 SMT 理论 2 , 
pALICA 程序 可 解释 为 一 个 命题 式 公 式 ， 其 中 变量 又 形成 另 一 种 理论 ， 即 C。 

4. 1 节 ， 在 一 个 智能 体 中 引入 基本 动作 元 素 一 一 行为 。 相 对 于 传统 的 行为 演 
算 ，ALICA 中 的 行为 具有 显著 的 持续 时 间 ， 这 通常 仅 是 松散 有 界 的 。4. 2 节 中 继 
续 介 绍 高 层 概念 一 一 规划 ， 即 根据 最 小 行为 来 构建 一 个 结构 。 其 余部 分 讨论 了 其 
他 概念 ， 如 同步 操作 、 角 色 和 语法 规范 的 程序 。 


4.1 行为 


在 真实 场景 中 ， 实 际 机 器 人 完成 动作 〈 如 到 达 某 一 特定 房间 ) 都 需要 大 量 
时 间 ， 且 是 非 确定 性 的 。 也 就 是 说 ， 机 器 人 可 能 失败 ， 或 即使 成 功 可 能 也 会 有 不 
同 结果 。 例 如 ， 由 于 传感器 的 噪声 和 执行 器 的 不 精确 ， 多 次 重复 到 达 厨 房 的 动作 
几乎 不 可 能 使 得 机 器 人 到 达 完 全 相同 的 地 点 。 
这 就 产生 了 编程 语言 中 的 第 一 个 元 素 ， 即 称 为 行为 的 封装 在 有 限 集 已 中 的 底 
层 不 可 分 动作 。 通 常 ， 行 为 只 能 在 特定 条 件 下 执行 ， 如 去 打开 一 个 已 经 开 着 的 门 
没有 任何 意义 ， 或 甚至 很 危险 地 到 达 一 个 不 可 测 的 道路 交叉 口 。 因 此 ， 在 执行 每 
个 行为 时 都 需要 一 个 前 提 条 件 : 
Pre; B> Ls 
在 此 ， 用 Pre(b) 表示 行为 b 的 前 提 条 件 。 另 外 ， 由 于 执行 行为 需要 一 定 的 
时 间 ， 因 此 这 可 能 也 是 在 整个 执行 期 间 应 保持 的 条 件 ， 称 为 运行 条 件 2 ; 
Run; B > Ls 
最 后 ， 在 大 多 数 情况 下 ， 行 为 意味 着 对 环境 产生 某 种 程度 的 改变 。 换 句 话 
说 ,一 个 智能 体 执行 这 些 行为 是 为 实现 一 个 后 置 条 件 : 


O 关于 SMT 求解 ， 请 参见 Nieuwenhuis HAWA? 。 
晶 ” 运 行 条 件 涉及 其 他 演算 中 的 不 变量 。 然 而 与 传统 非 变 量 不 同 ， 运 行 条 件 必须 初始 化 为 真 。 男 外 ， 
运行 条 件 可 改变 其 值 ， 如 由 于 环境 中 不 可 预见 的 变化 ， 会 引起 相应 的 故障 。 


Post; BF Ls 

根据 这 三 种 类 型 的 条 件 ， 就 可 能 形成 并 解决 规划 问题 ， 这 类 似 于 STRIPS 中 
的 命题 式 问题 “; 。 与 行为 演算 不 同 ， 在 此 并 没有 对 框架 问题 提出 一 个 解决 方 
案 "” ， 同 时 也 没有 定义 更 新 方程 。 实际 上 ， 本 书 工作 是 依赖 已 有 的 解决 方案 
(如 参考 文献 [92，134，150，168] ) ， 并 根据 具有 任何 信念 或 知识 表示 以 及 相 
应 更 新 语义 的 ALICA 可 互 换 操 作 。 

根据 这 种 思路 ， 对 行为 完成 标记 为 成 功 或 不 成 功 。 也 就 是 说 ， 行 为 本 质 上 是 
一 个 或 多 个 算法 实现 的 软件 组 件 ， 如 控制 器 或 各 种 搜索 范式 ， 并 不 需要 依靠 信念 
基 的 实现 来 涵盖 必要 的 概念 ， 也 不 需要 具有 推理 算法 的 能 力 来 推断 后 置 条 件 。 从 
语义 上 来 看 , 行为 需要 两 个 谓词 ， 即 Success(b) 和 Fail(5) 在 L(Pred,，Func) 
中 表示 ， 这 两 个 谓词 可 由 行为 6b 来 设置 。 值 得 注意 的 是 由 于 56 有限， 这 两 个 谓词 
应 编译 到 命题 式 逻 辑 中 。 

然而 规划 算法 通常 依靠 后 置 条 件 来 寻找 一 条 到 达 目 标 状 态 的 合适 路 径 。 在 某 
些 场景 中 ， 可 采用 仿真 器 来 试 运行 ， 但 这 通常 并 不 可 行 。 因此， 规划 需要 成 功 信 
号 和 后 置 条 件 的 等 效 软 辑 。 

定义 4.2 ”规划 公理 

pa = Success(b) <«+Post(b) 

然而 这 并 不 需要 推理 算法 上 < 在 所 有 行为 成 功 的 情况 下 来 证 明 后 置 条 件 。 尽 

管 对 于 任意 信念 集 8 ， 必 须 满足 
BU { È pian A Success( b) } FePost(b) 

这 实际 上 可 归结 为 一 个 假 言 推理 (前 件 肯 定式 ) 的 应 用 。 


4.2 规划 


给 定 不 可 分 割 的 行为 及 其 注释 ， 需 要 一 个 结构 来 形成 更 加 复杂 的 方案 或 规 
划 。 该 结构 构成 编程 语言 的 核心 。 一 般 而 言 ， 这 是 描述 为 实现 某 一 目标 、 保 持 某 
一 条 件 或 控制 一 个 动态 系统 所 要 执行 的 动作 。 描 述 一 个 规划 的 最 简单 方法 是 一 个 
行为 顺序 执行 的 列表 。 这 种 方案 或 策略 有 多 种 不 同 表示 方法 ， 是 对 上 述 简单 描述 
的 扩展 。 

动作 选择 的 一 个 主要 表示 方法 是 决策 树 ， 根 据 环境 的 某 种 特性 和 与 每 个 叶子 
节点 关联 的 行为 ， 在 决策 树 中 的 每 个 节点 进行 决策 。 决 策 树 及 其 更 简单 的 
形式 一 一 决策 列表 已 在 机 器 学 习 领 域 进行 了 深入 研究 。 请 参见 Quinlan 和 
Murthy ”有 关 决 策 树 学 习 的 研究 工作 以 及 参考 文献 [156] 中 表示 单个 智能 体 
行为 的 决策 列表 方法 。 
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单纯 的 决策 树 只 能 针对 反应 式 确定 性 行为 。 利 用 概率 原则 可 将 上 述 扩展 到 非 
确定 性 情况 ， 由 此 产生 更 适合 于 分 类 经 典 增强 学 习 技 术 的 表示 方法 。 对 于 更 复杂 
的 任务 ， 智 能 体 需 记 住 其 部 分 历史 。 以 一 种 受 限 方式 来 保存 历史 的 简单 方法 是 采 
用 有 限 状 态 自动 机 ， 这 样 可 比 决策 树 的 表示 更 加 紧凑 。 另 外 ， 还 需 注意 的 是 任何 
-个 决策 树 都 可 简单 地 表示 为 一 个 有 限 状 态 自 动机 。 近 年 来 ， 采 用 任务 网 络 和 层 
次 化 任务 网 络 (HTN) 来 表示 智能 体 行为 ， 主 要 是 针对 规划 问题 ”"” 。 本 书 的 
目的 是 寻求 一 种 更 具 表 现 力 的 编程 语言 ， 其 具有 表示 替代 、 循 环 和 例如 同步 以 及 
并 发 任务 之 间 依 赖 关系 的 团队 合作 等 特点 。 

因此 规划 的 基本 概念 与 有 限 自 动机 紧密 相关 ， 不 仅 可 形成 动作 序列 ， 还 可 循 
环 和 条 件 执行 。 规 划 集 P 中 的 每 个 规划 p 都 是 一 个 有 关 状 态 及 状态 转移 的 结构 。 在 
pALICA 程序 中 所 有 状态 的 集合 记 为 2。 状态 转移 是 直观 地 表示 一 个 智能 体 何 时 以 
及 如 何 从 一 个 状态 切换 到 另 一 个 状态 。 因 此 ， 每 个 状态 转移 表示 两 个 状态 之 间 的 
关系 ， 并 是 C 中 的 一 条 语句 。pALICA 程序 中 的 状态 转移 定义 为 MCZ xZ xls. X} 
于 每 个 规划 ， 状 态 转移 和 状态 之 间 的 关系 构成 了 一 个 有 向 图 ， 其 中 转移 为 边 ， 状 态 
为 节点 。 

状态 所 包含 的 直观 含义 是 类 似 于 petri 网 中 的 库 所 ， 处 于 某 个 状态 的 智能 体 应 
执行 该 状态 所 必须 完成 的 事情 ， 即 执行 一 个 或 多 个 行为 。 函 数 Behaviours; Zo 2” 
定义 了 一 个 状态 中 所 包含 的 行为 ， 并 由 处 于 该 状态 的 智能 体 执行 。 

一 个 有 限 自动 机 具有 一 个 表示 从 此 开始 计算 的 初始 状态 ， 然 而 仅仅 一 个 初始 
状态 不 足以 反映 多 智能 体系 统 的 行为 。 实 际 上 ， 可 设置 多 个 初始 状态 ， 对 于 每 个 
智能 体 子 集 ， 每 个 初始 状态 都 各 自 定义 一 个 起 始点 。 由 此 ， 自 动机 也 相应 地 分 为 
子 自动 机 ， 各 子 自动 机 之 间 无 需 关 联 ， 这 样 就 可 描述 相互 依赖 的 多 个 智能 体 的 行 
为 。5. 13 节 中 介绍 了 一 种 描述 该 依赖 关系 的 方法 ， 由 此 实现 一 个 规划 中 不 同行 
为 的 协调 合作 。 现 在 ， 引 入 一 种 任务 概念 ， 即 指向 规划 中 的 初始 状态 ， 并 确定 其 
中 的 子 自 动机 。 程 序 中 所 有 任务 的 集合 记 为 7 。 值 得 注意 的 是 ， 并 不 是 刻意 使 各 
个 任务 所 确定 的 子 自动 机 不 相交 。 子 自动 机 不 相交 是 有 利 的 ， 因 为 在 这 种 情况 
下 ， 每 个 状态 明确 地 确定 了 一 个 任务 。 这 可 用 来 限制 通信 成 本 ( 见 7.5 节 ) 。 

部 分 函数 mit: Px7Tm2 将 任务 和 规划 映射 到 一 个 初始 状态 ， 如 mit(p，r) 表 
示 规 则 p 中 任务 7 的 初始 状态 。 这 使 得 在 考虑 规划 集 时 ， 任 务 与 随后 所 用 的 具体 规 
划 ， 特 征 相互 独立 。 考 虑 到 任务 其 实 是 确定 规划 中 不 同 部 分 的 方法 ， 就 可 分 配 智能 
体 完 成 规划 中 的 不 同 部 分 ， 然 而 某 些 任务 仍 需要 多 个 智能 体 。 例 如 ， 对 于 单个 智能 
体 而 言 ， 某 个 物体 或 许 太 重 而 无 法 移动 ， 或 区 域 太 大 而 无 法 在 允许 时 间 内 搜索 完 。 
因此 ， 就 可 采用 多 个 智能 体 来 执行 规划 中 的 相同 任务 。 执 行 一 个 任务 的 智能 体 个 数 
可 能 受 某 些 约束 条 件 的 限制 。 利 用 部 分 函数 &: PxT>No x(NoU1%|) 可 限定 
智能 体 的 个 数 ， 如 &(p，7) = (m, m) 表明 在 规划 p 中 执行 任务 7 it BBD n, 
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个 ,最 多 nn 个 智能 体 。 

某 些 规划 意味 着 要 保持 某 种 条 件 并 无 限 运 行 。 然 而 另外 一 些 规划 是 目标 导向 
的 , 一旦 达到 期 望 的 环境 状态 则 终止 运行 。 为 此 ， 在 此 将 终止 状态 也 包含 在 规划 
结构 中 。 设 States(p) 表示 规划 p 的 状态 ， 则 状态 Success(p) CStates(p) 表示 
成 功 完成 的 终止 状态 。 一 旦 智能 体 达到 该 状态 ， 则 表明 已 成 功 完 成 该 任务 。 同 
理 , 用 Fail(p) CStates(p) 表示 失败 的 终止 状态 集 。 当 智能 体 达到 一 个 失败 状 
态 时 ， 表 明 没 有 完成 任务 。 在 5.5 节 中 ,将 详细 讨论 成 功 的 结束 。5. 13. 2 节 中 
将 介绍 处 理 失败 的 可 能 性 。 

根据 所 定义 的 元 素 ， 就 可 表示 某 些 复杂 行为 ， 如 图 4. 1 中 服务 机 器 人 领域 的 
示例 。 等 待 规划 包含 两 个 任务 : 一 个 是 服务 于 餐桌 的 一 组 机 器 人 ; 另 一 个 是 负责 
从 门口 到 服务 区 域 的 单个 机 器 人 。 


图 4.1 规划 示例 : 等 待 


然而 这 里 有 两 个 主要 缺点 : 首先 ， 由 于 问题 比较 复杂 ， 因 此 针对 具体 解决 方 
案 ， 还 没有 采用 一 种 抽象 复杂 性 的 方法 ; 其 次 ， 在 单个 状态 机 中 表示 代替 方案 比 
较 繁 琐 。 若 可 能 有 另 一 种 转换 ， 需 要 快速 适应 时 ， 则 可 快速 地 完全 包括 所 有 连通 
的 状态 机 。 这 些 问 题 都 需要 一 种 方法 来 相互 比较 各 种 规划 。 

因此 ， 在 此 引入 类 似 于 针对 行为 定义 的 规划 条 件 。 增 加 函数 Pre 和 Run 来 将 
规划 集 与 £ 语 句 相 对 应 : 

Pre: PUB > Ls 
Run; PUB > Ls 
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为 便于 规划 ， 还 应 设 定 一 个 后 置 条 件 。 由 于 定义 了 终止 状态 的 概念 ， 因 此 可 
ee ee ee rr st 
进行 建 模 。 同 理 ， 失 败 状态 也 要 设置 后 置 条 件 ， 这 可 通过 一 个 推理 模块 来 进行 失 
败 分 析 。 在 此 增加 Post 部 分 函数 

Post: ZUBt>Ls 
将 终止 状态 与 后 置 条 件 相对 应 。 在 语义 上 ， 状 态 的 后 置 条 件 与 行为 的 后 置 条 件 有 
很 大 不 同 。 如 果 达 到 一 个 终止 状态 ,这 表明 满足 后 置 条 件 。 然 而 ， 根 据 智能 体 的 
内 部 信念 ， 后 置 条 件 评估 为 真 并 不 意味 着 一 个 智能 体 或 即使 是 相应 的 智能 体位 于 
相应 的 终止 状态 。 在 5. 13 节 介 绍 运行 时 语义 时 ， 将 讨论 上 述 区 别 。 

根据 所 介绍 的 条 件 集 合 ， 对 于 一 种 具体 情况 ， 可 对 当前 规划 或 规划 过 程 中 的 
假设 条 件 进行 评估 。 设 C(Pred，Func) 单调 2， 则 难以 表示 在 应 满足 多 个 前 置 
条 件 和 运行 时 条 件 的 所 有 规划 中 所 首选 的 那个 规划 。 

因此 ， 引 入 第 4 个 元 素来 评估 一 个 规划 ， 即 效用 函数 (utility function) 。 一 
个 效用 函数 与 一 种 情况 相对 应 ， 由 信念 基 ， 即 一 组 C(Pred，Func) 中 的 公式 进 
行 描述 来 定义 总 顺序 集合 。 根 据 一 种 常用 选择 ， 设 效用 函数 映射 到 实数 集 : 

U: P32Ls 3R 
每 个 规划 疡 E7P 都 有 一 个 效用 函数 ， 记 为 UV(pP) ， 反 过 来 又 对 应 一 组 实数 公式 。 然 
后 ， 根 据 情 况 来 评价 规划 。 由 于 规划 可 能 有 多 个 初始 状态 ， 因 此 也 可 对 执行 规划 
的 不 同方 式 进行 评价 ， 即 不 同 分 配 ， 这 将 在 5.8 节 中 讨论 。 

给 定 效 用 函数 以 及 前 置 和 运行 条 件 ， 相 对 于 某 一 种 情况 ， 可 对 规划 进行 比 
较 。 为 允许 智能 体 通过 比较 从 一 组 候选 规划 中 选择 其 中 一 个 ， 在 此 将 规划 进行 分 
类 ， 称 之 为 规划 类 型 。 这 样 的 分 组 规划 (不 是 必要 条 件 ) 可 直接 实现 同一 目标 。 
pALICA 程序 中 所 有 规划 类 型 的 集合 记 为 Pu E2”。 属 于 规划 类 型 P 的 一 个 规划 p 
也 称 为 P 的 实现 。 

为 促进 层次 结构 的 思想 ， 将 这 些 集 合作 为 状态 属性 引入 ， 这 样 每 个 状态 可 以 
与 包含 行为 的 方式 一 样 包含 组 候选 规划 集 。 函 数 

PlanTypes: Z = 2 
将 每 个 状态 映射 到 候选 规划 集中 的 空 集 ， 这 意味 着 每 个 规划 类 型 都 是 并 行 执 
行 的 。 

状态 和 规划 类 型 之 间 的 关系 以 及 规划 类 型 与 规划 之 间 的 关系 构成 了 一 个 规划 
有 向 图 。4. 5 节 中 ， 将 该 图 限制 为 一 个 树 。 树 中 最 顶层 元 素 由 规划 po 确定 。 其 中 
包含 单个 任务 zo。 和 单个 状态 z。 这 样 ，po 就 可 看 作 多 智能 体 程序 中 的 主 程序 。 在 


e 


加 ”参见 参考 文献 [14] 确定 如 何 将 选择 与 非 单调 逻辑 相关 联 
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此 ， 将 该 结构 称 为 规划 树 。 

图 4. 2 表明 如 何 通过 层次 化 抽象 来 简化 图 4. 1 中 的 Waiting 规划 。 引 入 两 个 
新 的 规划 类 型 : 一 个 是 用 于 服务 一 个 餐桌 ; 另 一 个 是 用 于 从 房间 传送 食物 。 这 两 
个 规划 类 型 可 对 每 个 任务 的 复杂 性 进行 抽象 ， 同 时 也 增加 了 重用 的 可 能 性 。 例 
如 ， 从 房间 传送 食物 的 规划 也 可 用 于 其 他 设置 。 规 划 GetOrder 和 BringFood 是 
HandleTable 的 两 个 实现 ,分 别 用 于 处 理由 其 各 自 的 前 置 条 件 区 分 的 某 一 具体 情 
况 。 值 得 注意 的 是 ， 只 有 规划 BringFood 在 终止 状态 结束 ， 这 表明 成 功 实现 对 某 
一 特定 餐桌 的 服务 。 


BringFood Pre:Havefood( Waiter) 


图 4.2 规划 示例 : 层次 化 等 待 


上 面 所 介绍 的 规划 结构 在 第 5 章 中 将 具有 重要 作用 ， 因 此 需 引 入 简化 规划 表 
示 的 一 些 宏 : 
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© 利用 PlanTypes * (z) 来 表示 规划 类 型 的 传递 性 ， 可 直观 地 定义 为 

v PlanTypes(z) G PlanTypes* (z), 

v WÈ Pe PlanTypes* (z2), W) ( Yz’, p)p eP Az’ e States (p)— PlanTypes 
(z') €PlanTypes* (z). 

@ Plans; Z+>2”, Plans(z) RIR TJERA z 中 执行 的 规划 集 : 

Plans (z) ea U PlanTypes( z) 
@ Plans* : 2 一 27 为 规划 集 的 传递 闭 包 ， 定 义 为 
Plans * (z) = U PlanTypes * (z) 

@ Reachable; Px T 一 GZ 表示 状态 集 与 mit(p，7) 的 传递 连接 ， 即 任务 r 在 
规划 p 中 可 达 。 这 可 直观 地 定义 如 下 : 

v Init(p, T) e Reachable(p, 7). 

v Wn ze Reachable(p, +), 则 ( Yz’, b)(z, 2’, p) e W—>z' e Reachable 


(py To 
@ 宏 ChildOf 表示 规划 间 的 父子 关系 : 


ChildOf(p, p’) jz)zeStates(p) A ( 3 P)P e PlanTypes(z) Ap' eP 
ChildOf 的 传递 闭 包 由 ChildOf* 表示 。 


4.3 同步 


到 目前 为 止 ， 所 介绍 的 语言 元 素 已 可 描述 协调 合作 行为 。 第 5 章 将 讨论 如 何 
通过 将 执行 ALICA 程序 的 智能 体 的 内 部 状态 反映 在 其 他 智能 体 的 信念 基 中 来 实 
现 。 然 而 根据 场景 不 同 ， 需 要 不 同 层次 或 不 同 程度 的 协调 合作 。 例 如 ， 合 作 抬 起 
一 个 易 碎 物 体 时 所 需 的 协调 动作 要 比 依次 离开 一 个 房间 更 加 密切 。 在 约束 限制 方 
面 ， 应 在 通信 延迟 允许 条 件 下 尽 可 能 地 执行 严格 同步 的 动作 。 

因此 ， 根 据 Kinny 等 人 5 提出 的 同步 概念 ， 引 入 另 一 个 语言 元 素 。 与 
Kinny 的 研究 工作 不 同 ， 本 书 采用 一 个 显 式 语言 元 素来 区 分 松散 同步 与 紧密 
同步 的 执行 。 通 过 对 其 他 智能 体内 部 状态 的 局 部 表示 即 可 简单 地 实现 松散 同 
步 。 而 对 于 紧密 同步 ， 在 此 采用 了 语言 元 素 同步 。 同步 ;为 CW 的 转移 集 
合 。 在 ALICA 程序 中 ， 用 A 表示 所 有 同步 的 集合 。 直 观 上 看 ， 同 步 需要 涉 
及 的 所 有 智能 体 都 应 同步 地 沿 各 自转 移 进行 动作 ， 即 在 同一 时 间 。 另 外 ， 整 
个 智能 体 集合 都 沿 上 述 转 移动 作 ， 或 根本 没有 动作 。 这 需要 类 似 联合 意图 的 
一 定 程 度 的 承诺 '”!。 在 其 他 编程 语言 中 也 引入 了 类 似 结构 ， 如 规划 语言 
MAPL 中 的 同步 语言 行为 "1 。 
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4.4 角色 


规划 描述 了 行为 ， 即 描述 了 如 何 达 到 某 个 目标 。 任 务 表示 规划 中 的 具体 部 
分 。 为 将 智能 体 分 配给 任务 ， 需 要 称 为 角色 的 第 3 个 概念 。 赋 予 智能 体 相应 的 角 
色 ， 以 允许 评估 一 个 智能 体 对 某 一 特定 任务 的 充分 性 ， 并 建立 一 个 一 般 的 团队 构 
成 。 根 据 Wooldridge 等 人 "的 思想 ，ALICA 中 的 角色 反映 了 一 个 智能 体 在 团队 
中 的 期 望 功能 。 该 功能 由 问题 域 、 智 能 体能 力 和 团队 构成 来 确定 。 例 如 ， 配 置 有 
先进 传感器 的 智能 体 可 比 具 有 中 等 感知 能 力 的 智能 体 执行 更 有 效 的 搜索 任务 ， 由 
此 产生 了 由 Campbell 和 Wul™ 所 给 出 的 角色 和 任务 定义 。 

设 及 表示 一 个 pALICA 程序 中 所 有 角色 的 集合 ， 然 后 函数 Pref: RxT > 
[ -1, 1] 将 角色 和 任务 映射 到 区 间 [ -1，1] 中 的 一 个 实数 ， 以 表示 对 于 特定 角 
色 的 任务 优先 级 。 

有 多 种 方法 用 于 解决 为 智能 体 分 配角 色 的 问题 。 最 简单 的 情况 是 ， 每 个 智能 
体 都 赋予 一 个 固定 角色 。Gerkey' 将 由 此 产生 的 问题 描述 为 单 任 务 单 机 器 人 的 
瞬时 分 配 (ST-ST-IA) 。 并 可 在 多 项 式 时 间 内 求解 。 

更 复杂 的 技术 可 适用 于 团队 成 员 损 坏 或 部 分 功能 丧失 的 情况 ， 使 得 每 个 智能 
体 可 具有 多 个 角色 或 多 个 智能 体 具 有 同一 角色 ， 并 考虑 在 未 来 事件 中 可 能 发 生 的 
问题 。 在 这 种 情况 下 ， 如 果 考 虑 未 来 可 能 出 现 的 重新 分 配 ， 问 题 的 复杂 性 就 会 变 
为 无 解 55 或 甚至 NEXP-time |"! 。 近 来 ，Campbell 和 Wu 对 可 能 的 角色 分 配 算 
法 进行 了 研究 。 

执行 一 个 ALICA 程序 ， 需 要 每 个 智能 体 赋予 一 个 非 空 角 色 集 ， 且 该 集合 对 团 
队 所 有 成 员 已 知 。 本 书 没 有 对 ALICA 限制 一 个 特定 的 角色 分 配 算法 ， 只 是 给 出 
ALICA 中 关键 概念 的 一 般 性 描述 。5. 6 节 将 介绍 一 个 适当 的 角色 分 配 算法 实例 。 

为 根据 智能 体 所 具有 的 不 同 技能 和 能 力 来 实现 角色 分 配 ， 在 此 还 需 另 一 个 概 
念 : 能 力 。 能 力 是 对 特殊 技能 及 其 某 种 评价 程度 的 描述 ， 如 “机 器 人 非常 快 ” 
或 “该 角色 需要 抓 取 能 力 ” 等 非 正 式 语句 描述 都 是 指 能 力 。 再 次 强调 ， 在 此 并 
不 对 如 何 表示 能 力 进行 任何 限制 ， 但 在 5. 6 节 中 将 通过 介绍 一 种 具体 的 角色 分 配 
算法 来 对 此 进行 深入 讨论 。 在 此 ， 用 C 表 示 所 有 能 力 的 集合 。 

函数 Cap: 及 UA 中 2 将 智能 体 与 其 提供 的 能 力 相对 应 ， 并 将 角色 与 其 所 需 
的 能 力 相 对 应 。 给 定 智能 体 、 角 色 及 其 各 自 所 需 和 所 应 具有 的 能 力 ， 角 色 分 配 算 
法 可 将 智能 体 和 角色 相 匹 配 。 然 而 ， 只 有 角色 与 智能 体 数量 相同 且 每 个 智能 体 必 
须 只 能 选择 一 种 角色 (ST-SR) 时 ， 才 能 实现 明确 分 配 。 另 外 ， 不 能 考虑 其 他 附 
加 信息 。 因 此 ， 本 书 引入 第 3 个 概念 : 队 形 。 给 定 一 组 特定 的 智能 体 以 及 可 能 需 
要 决策 的 场景 ， 通 过 提供 所 需 角色 的 信息 及 其 各 自 的 优先 级 ， 队 形 可 解决 上 述 问 
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题 。 由 于 队 形 很 大 程度 上 依赖 于 角色 分 配 的 语法 ， 在 此 留 作 一 个 开放 问题 ， 并 在 
5.6 节 通 过 一 个 实例 进行 讨论 。 


4.5 良好 架构 


在 上 述 章节 中 ， 介 绍 了 pALICA 的 语言 元 素 ， 并 阐述 了 之 间 的 某 些 关系 ， 如 
规划 树 。 现 在 从 语法 形式 上 来 约束 pALICA 程序 的 语法 ， 以 保证 这 些 关系 的 预期 
结构 ， 由 此 产生 架构 良好 的 pALICA 程序 的 概念 。 设 这 ,为 一 个 包含 以 下 公理 的 
集合 : 

e 高 层 规划 仅 包含 一 个 状态 zo 和 一 个 任务 To: 


States( po) = | zo} A Tasks( (po) = { To! (4.1) 
© 状态 最 多 属于 一 个 规划 : 
(Vp, p’ &P)States(p) NStates(p’) = 乡 VP=P (4.2) 


© 在 不 同 规划 中 不 存在 状态 转移 : 
(V(z,, >, 6) eW)( dpeP)z, eStates(p) Az, e States(p) (4.3) 
o 同步 仅 发 生 在 同一 个 规划 中 : 
(VseA)( Vw, w es)( Jz %, 23, %, db, QW = (Zia %, Qy) 


.4 
Aw’ =(2,, z4, ġa) \( dpeP)z, eStates(p) Az e States(p) C4 4) 
@ 失败 集 和 成 功 集 是 相应 状态 集 的 不 相关 子 集 : 
(VpeP)Success(p) UFail(p) CStates(p) (4.5) 


ASuccess(p) NFail(p) =Ø 
o 与 某 一 规划 关联 的 任务 确定 了 该 规划 中 的 一 个 初始 状态 : 
(VreTasks(p))( jzeStates(p))Init(p, 7) =z (4.6) 
© 所 有 规划 一 任务 对 都 具有 一 个 相关 的 有 效 基数 间隔 : 
(VpeP, reT)reTasks((p)—( dn,, n)é(p, 7)= (nm, m) An, Sn, 
(4.7) 
© 每 个 成 功 状态 和 失败 状态 都 关联 一 个 后 置 条 件 : 
( VpeP)( VzeSuccess(p) UFail(p))( do) Post(z) = 中 (4.8) 
@ 终止 状态 没有 附加 子规 划 或 行为 : 
(Vz)(( 3p)zeSuccess(p) Vz e Fail(p) ) 一 PlanTypes(z) = Ø 
A Behaviours( z) = Ø 
@ 高 层 规划 与 所 有 规划 相连 : 
(Vp)p =po V ChildOf* (po，P) (4. 10) 
© 每 个 规划 最 多 有 一 个 父 节点 : 


(4.9) 


( Vp, pı, P2)ChildOf(p,, p) AChildOf(p,, p)—p, =p, (4. 11) 
@ 父子 关系 的 传递 闭 包 是 非 对 称 的 : 
(Vp, p’)ChildOf* (p, p')—— ChildOf* (p', p) (4. 12) 
一 个 ALICA EF HAWE E ITERA REAR 
SK (4.1) 保证 在 规划 树 中 存在 一 个 唯一 的 根 节点 。 由 于 相对 于 最 高 层 任何 
智能 体 所 具有 的 可 能 状态 数 有 限 : 无 论 是 参与 的 还 是 没有 参与 的 智能 体 ， 这 将 简 
化 智能 体 的 执行 和 协调 合作 。 式 (4.2) ~ 式 (4.6) 将 规划 的 内 部 结构 限制 为 
局 部 ， 即 属于 不 同 规划 的 元 素 不 能 相连 。 式 (4.6) ~ 式 (4.8) 保证 了 任务 执 
行 所 需 的 某 些 必要 元 素 ， 如 任务 一 规划 元 组 中 的 基数 。 值 得 注意 的 是 ， 如 基数 
(0, ©) 和 后 置 条 件 T 等 具体 元 素 都 是 允许 的 。 
A (4.9) 不 允许 终止 状态 有 子 节点 。 尽 管 这 并 不 是 绝对 必要 的 ， 但 直观 
上 ， 终 止 状态 会 终止 执行 ， 因 此 不 应 再 包含 内 部 程序 。 
式 (4.10) ~ 式 (4.12) 将 规划 树 结构 限制 为 一 个 有 限 状 态 树 。 更 具体 的 ， 
式 (4.10) 强调 高 层 规划 po 传递 连接 到 所 有 规划 。 式 (4.11) 强调 每 个 规划 最 
多 有 一 个 父 节 点 ， 这 与 式 (4.10) 一 起 意味 着 除了 po 之 外 ， 每 个 规划 都 只 有 一 
个 父 节点 。 最 后 , 式 (4.12) 强调 了 父子 关系 传递 闭 包 的 不 对 称 性 。 由 于 了 有 
限 ， 规 划 树 也 有 限 。 值 得 注意 的 是 ,根据 式 (4.10) 和 式 (4. 12)，po 不 能 有 父 
节点 。 
从 软件 架构 来 看 ， 强 制 执行 一 个 树 结构 似乎 过 于 严格 ， 在 具体 实现 上 也 可 利 
用 一 个 有 向 非 循环 图 ， 使 得 规划 可 在 不 同 环境 下 重用 。 运 行 时 引擎 识别 不 同 的 规 
划 实 例 ， 并 进行 相应 处 理 ， 就 好 比 是 不 同 规划 。 在 此 ， 将 结构 限制 为 树 结构 是 为 
了 避免 过 于 复杂 的 符号 ， 这 在 区 分 规划 和 规划 实例 时 可 能 需要 。 值 得 注意 的 是 ， 
通过 复制 具有 多 个 父 节点 的 节点 ,一 个 有 向 非 循环 图 可 容易 地 转化 为 树 结构 ， 因 
此 相对 于 非 循环 图 ， 表 现形 式 并 不 受 限 。 
然而 ， 在 理论 和 实现 上 ， 规 划 树 不 能 含有 循环 。 若 允许 循环 则 需 递归 定义 ， 
从 而 增强 表现 力 ， 在 多 智能 体 中 递归 语法 并 不 简单 。 例 如 ， 在 给 定时 间 内 ， 每 个 
智能 体 都 可 在 不 同 递归 深度 下 工作 ， 因 此 本 书 不 考虑 递归 。 


4.6 pALICA 语法 元 素 概述 


总 而 言 之 ,一 个 pALICA 程序 仅 包含 少量 不 同 的 元 素 。 首 先 ， 域 签名 定义 了 
可 能 的 智能 体 集合 以 及 有 关 环 境 的 逻辑 表示 信念 。pALICA 的 核心 元 素 是 规划 ， 
其 是 解决 给 定 问题 的 形式 化 方法 。 规 划 包括 状态 及 其 转移 ， 通 过 同步 转移 可 增强 
智能 体 之 间 的 紧密 看 合 。 状 态 包括 表示 候选 规划 集 的 规划 类 型 ， 男 外 状态 还 包括 
行为 ， 即 不 可 分 的 动作 程序 。 由 此 产生 一 个 树 形 图 ， 其 中 节点 是 规划 。 任 务 规定 
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了 哪些 智能 体 可 被 分 配 规划 中 的 初始 状态 ， 这 样 的 分 配 考 虑 了 每 个 智能 体 的 角 
色 。 根 据 智能 体 所 需 和 所 具有 的 能 力 ， 为 智能 体 分 配角 色 。 

表 4. 1 总结 了 pALICA 中 的 正式 元 素 。 除 L( Pred，Func) 之 外 ， 所 有 集合 都 
是 有 限 的 。 如 果 C(Pred，Func) 编译 为 命题 式 逻 辑 ， 则 也 可 允许 程序 编译 为 命 
题 式 逻辑 。 通 过 表 4. 2 中 所 列 的 (部 分 ) 函数 可 构成 单个 元 素 。 


#4.1 pALICA 程序 中 的 元 素 


(A, £) BEX, 域 签名 包括 交互 智能 体 集合 以 及 表示 环境 的 逻辑 
R 角色 集 该 集合 包括 所 有 智能 体 可 分 配 的 角色 
B 行为 集 行为 是 不 可 分 的 动作 程序 ， 这 构成 与 环境 交互 的 方式 
p | mas 每 个 规划 描述 了 一 个 特定 协调 合作 的 行为 
Py 规划 类 型 集 ”| ”一 个 规划 类 型 是 一 组 候选 规划 的 集合 
at 每 个 任务 直观 描述 了 规划 中 的 功能 或 责任 ， 意 味 着 由 一 个 或 多 
个 智能 体 来 完成 
3 — eee ee oe 
行为 
ETB 2, 2, 6) RRM RA a 和 下 二 状态 己 以 及 条 件 
is | aiai peL (Pred, Func) 的 关系 
A 同步 集 用 于 表示 同步 行为 所 需 的 每 个 相关 转移 
C 所 有 能 力 集合 | ”能 力 用 于 匹配 智能 休 和 角色 
a 顶层 元 素 顶层 规划 ， 任 务 和 状态 分 别 构成 程序 图 的 根 节点 


表 4.2 pALICA 程序 的 结构 定义 


States; P >22 状态 函数 将 规划 与 约束 状态 集 相 对 应 

Tasks: 刀 上 27 任务 函数 将 规划 与 相关 任务 集 相 对 应 

é: PxT ONox (NoU 1%|) 定义 了 规划 p 中 一 个 任务 7 所 分 配 的 智能 体 上 限 和 下 限 
Init: PxT >Z 初始 化 函数 将 规划 和 任务 与 相应 初始 状态 相对 应 

Pre: PUB mLs Pre(p) 表示 规划 或 行为 p 的 前 置 条 件 

Run; PUB >Ls Run (p) 表示 规划 或 行为 的 运行 条 件 

PlanTypes: Z++2PV PlanTypes(z) 表示 在 状态 z 中 执行 的 规划 类 型 集 
Behaviours; Z 28 Behaviours(z) 表示 在 状态 z 中 执行 的 行为 集 

Success; P 22 Success(p) 表示 规划 p 的 终止 状态 集 ， 表 明 规 划 的 成 功 执行 
Fail; P++22 Fail(p) 表示 规划 p 的 终止 状态 集 ， 表 明 规划 没有 成 功 执行 
Post: Z 一 Cs | Post(z) 为 部 分 函数 ， 将 规划 的 终止 状态 与 后 置 条 件 相对 应 
U: PO2Ls SR U (p) Æp 的 效用 函数 ， 相 对 于 一 组 公式 ， 对 p 评估 

Pref; RxT +>[ -1, 1] Pref(r, 7) 是 任务 r 对 角色 r 的 优先 权 


第 5 章 语 义 


在 前 面 的 章节 中 ， 已 介绍 了 pALICA 语言 及 其 语法 ， 由 此 可 区 分 语法 错误 和 
格式 规范 的 程序 。 在 此 ， 将 介绍 格式 规范 的 程序 意义 。 

这 里 定义 的 语义 有 三 个 目的 : 首先 ， 可 直观 理解 pALICA 程序 ， 使 得 一 个 开 
发 人 员 可 轻松 地 设计 多 智能 体 程序 ; 其 次 ， 详 细 规 范 了 智能 体 如 何 执行 程序 ， 并 
定义 了 一 系列 可 能 的 执行 引擎 ; 第 三 ， 可 允许 各 种 性 能 的 机 械 证 明 ， 如 存活 性 或 
安全 条 件 。 在 上 述 三 个 目的 中 ， 认 为 第 二 个 目的 最 为 重要 ， 这 是 因为 我 们 更 关心 
实际 应 用 ， 即 程序 的 执行 。 

接 下 来 ， 声 明了 一 组 语义 应 遵循 的 规则 。 之 后 ， 通 过 一 个 以 最 普通 方式 定义 
的 智能 体 模型 ， 来 介绍 智能 体 如 何 理解 ALICA 的 语义 。 然 后 ， 给 定 一 个 特定 的 
ALICA 程序 ， 定 义 描述 智能 体 的 内 部 表示 如 何 随时 间 变 化 的 转移 系统 ”的 操作 


语义 。 
5.1 基本 原则 


ALICA 语义 的 设计 遵循 以 下 原则 : 域 的 独立 性 、 自 治 性 和 局 部 性 。 这 意味 
着 在 不 同 域 特点 下 (如 不 可 靠 通信 ) ， 可 保证 可 移植 性 、 扩 展 性 和 和 鲁 棒 性 。 

域 的 独立 性 ”尽管 机 器 人 场景 是 本 书 的 重点 , 但 ALICA 的 设计 具有 域 的 独 
立 性 ， 使 得 本 书 结果 可 用 于 其 他 域 ， 而 并 非 局 限于 所 讨论 的 域 。 因 此 ， 对 于 智能 
体 如 何 表示 其 环境 ，ALICA 尽 可 能 少 地 进行 假设 。 例 如 ， 对 于 环境 ， 完 全 可 能 
利用 一 个 封闭 的 环境 假设 或 一 个 开放 的 环境 假设 ， 而 且 还 可 采用 一 个 经 典 的 一 阶 
逻辑 、 一 个 模 态 逻辑 或 甚至 一 个 如 概率 逻辑 的 混合 方法 。 一 个 特定 的 ALICA 程 
序 可 通过 定义 为 签名 的 一 部 分 的 C 语 言 来 表示 环境 。 

自治 性 ”在 第 1 章 中 列举 的 要 求 之 一 是 具有 处 理 不 可 靠 通信 的 能 力 。ALICA 
可 通过 执行 元 余 计算 来 解决 该 问题 ， 即 由 所 有 智能 体 独立 自主 地 进行 团队 相关 决 
策 。 随 后 ， 对 不 一 致 的 决策 进行 检测 ， 并 根据 相应 信息 (如 通过 通信 或 行为 识 
别 ) 进行 修正 。 该 原则 使 得 ALICA 即使 在 非常 恶劣 的 网 络 条件 下 也 可 工作 ， 如 
参考 文献 [159] 所 示 。 由 于 宛 余 计算 ,消息 传递 时 间 几 乎 无 限制 。 对 于 该 规 
则 ， 只 有 一 个 例外 ， 即 有 关 无 行为 能 力 智能 体 的 识别 。 在 本 书 的 实现 中 ， 假 设 如 
果 在 某 一 段 时 间 内 没有 从 一 个 智能 体 处 接收 到 消息 ， 则 该 智能 体 将 不 能 再 正常 运 
行 。 所 间隔 的 时 间 取 决 于 网 络 质量 、 问 题 域 的 动态 程度 以 及 智能 体 失控 的 可 能 
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性 。 在 7.5 节 中 ,将 对 此 进行 详细 讨论 。 

局 部 性 ”执行 一 个 ALICA 程序 的 团队 智能 体 的 全 局 状态 由 所 有 参与 智能 体 
的 联合 状态 表示 。 为 应 对 团队 所 面临 问题 的 复杂 性 ，ALICA 采用 层次 化 编程 结 
构 。 所 需求 解 的 问题 解 由 规划 描述 ， 即 根据 任务 来 分 解 团队 ， 并 采用 子规 划 来 求 
解 可 能 的 子 问题 。 

保持 树 结构 ， 并 对 所 有 决策 执行 必要 计算 可 很 好 地 解决 单个 智能 体 计算 能 力 
不 足 的 问题 ， 这 或 许 是 为 什么 首选 多 智能 体系 统 的 原因 。 因 此 ，ALICA 采用 一 
种 局 部 性 原则 。 每 个 智能 体 按照 其 采用 的 规划 ， 并 根据 这 些 规划 执行 相关 决策 。 
对 于 没有 参与 的 团队 的 部 分 全 局 状态 ， 该 智能 体 可 忽略。 

如 果 问 题 可 分 解 为 子 问题 ， 则 这 种 原则 可 显著 减少 大 型 团队 的 计算 代价 。 因 
此 相对 于 所 参与 智能 体 的 个 数 ， 局 部 性 原则 大 大 增 大 了 可 扩展 性 ， 这 也 是 人 类 处 
理 复杂 问题 的 本 性 。 例 如 ， 在 足球 比赛 中 ， 若 某 个 进攻 队员 正 带 球 朝向 对 方 球 
门 ， 这 时 将 无 需 考 虑 防守 本 方 球门 的 队友 的 精确 位 置 ， 只 需 知 道 有 队友 在 防守 即 
可 。 这 等 效 于 ALICA 中 在 规划 层次 结构 的 较 高 层 上 已 知 对 哪个 任务 分 配 了 哪些 
智能 体 的 思想 。 在 动态 程度 较 小 的 场景 中 ， 人 类 也 采用 同样 的 原则 。 如 果 你 的 同 
事 参 与 大 型 合作 项 目 ， 则 无 需 考 虑 其 所 做 的 具体 工作 。 实 际 上 ， 这 足以 获悉 一 个 
抽象 的 进展 情况 。 


5.2 智能 体 模型 


在 2.1 节 中 ,介绍 了 智能 体 的 概念 。 根 据 所 介绍 的 一 个 智能 体 的 最 通用 模 
型 ， 不 作 任何 限制 ， 只 是 在 恰当 位 置 增加 ALICA 控制 结构 。 假 设 一 个 控制 回路 
由 信念 更 新 、 推 理 和 执行 三 部 分 组 成 ，ALICA 将 其 集成 到 推理 过 程 。 

之 前 的 信念 更 新 集成 了 智能 体 对 环境 内 部 模型 中 的 感知 信息 。 在 一 个 
ALICA 程序 中 ，L( Pred，Func) 用 于 表示 该 模型 中 的 实际 情况 和 关系 。 推 理 
步骤 包括 任何 形式 的 内 部 计算 ， 如 规划 和 意图 的 更 新 。 最 重要 的 是 ， 在 该 过 
程 中 更 新 了 所 执行 ALICA 程序 的 内 部 状态 。 也 就 是 说 ， 在 此 执行 ALICA 的 
计算 步骤 。 

计算 阶段 按照 推理 过 程 所 决定 的 动作 命令 来 执行 。 在 ALICA H, KERR 
布 动作 命令 的 不 可 分 行为 程序 。 这 些 命令 可 进一步 由 中 间 推 理 步骤 处 理 。 最 后 ， 
在 该 过 程 中 还 包括 所 有 主动 通信 ， 这 是 由 于 认为 发 送信 息 的 动作 是 其 本 身 的 一 种 
行为 。 

并 不 要 求 智 能 体 必须 严格 按照 图 2. 1 中 的 模型 ， 这 只 是 一 个 必要 步骤 的 参 
考 ， 以 及 所 建议 的 步骤 顺序 。 尤 其 是 对 于 目前 的 并 行 硬件 架构 ， 需 要 采用 更 加 模 
块 化 的 架构 。 然 而 仍 需 将 感知 信息 集成 到 内 部 模型 ， 在 推理 步骤 中 反映 结果 ， 并 
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更 新 必要 动作 。 在 第 7 章 ， 将 介绍 一 种 更 精细 的 软件 体系 结构 。 

从 ALICA 的 角度 来 看 ， 一 个 智能 体 在 任意 时 间 点 都 有 一 个 配置 。 该 配置 反 
映 了 智能 体 的 内 部 状态 、 信 和 念 基 的 组 成 、 角 色 以 及 执行 ALICA 程序 中 的 状态 。 

定义 5.1 (智能 体 配置 ) ”对 于 任 一 智能 体 a eA， 用 Conf(a) 表示 其 配置 。 
pALICA 中 一 个 智能 体 的 配置 为 一 个 元 组 (38, Y, E, R), Hep 

© B 为 智能 体 的 信念 基 。 

o 7 为 智能 体 的 规划 基 。 

@ ACBx2 是 智能 体 的 执行 集 ， 即 执行 智能 体 的 行为 一 状态 元 组 集 。 

o RR 为 当前 角色 a 的 集合 。 

信念 基 包 括 环 境 的 当前 模型 ， 即 智能 体 认为 为 真 的 任何 事物 。 规 划 基 是 对 程 
序 中 智能 体 当 前 状态 的 一 种 表示 。 执 行 集 包含 智能 体 所 执行 的 行为 b 及 其 发 生 时 
的 状态 z 所 构成 的 所 有 元 组 (58，z)， 称 为 b 的 文 义 。R 中 包括 团队 中 所 有 的 角 
Éa, 

最 初 ， 除 了 特定 域 的 信念 外 ， 一 个 智能 体 的 配置 为 空 。 因 此 启动 后 ， 智 能 体 
无 法 对 团队 的 当前 状态 进行 任何 假设 。 特 别 是 ， 智 能 体 不 相信 应 执行 任何 规划 。 

定义 5.2 ”一 个 智能 体 初始 配置 为 (B, 85，G，G) 。 这 样 使 得 B 不 包含 有 关 
ALICA 程序 中 状态 的 任何 信念 。 

操作 语义 定义 了 随 着 智能 体 执行 程序 如 何 更 新 配置 。 在 介绍 相应 规则 之 前 ， 
首先 将 更 加 详细 地 讨论 智能 体 配置 的 元 素 。 

5.2.1 规划 基 

智能 体 的 规划 基 反 映 了 其 当前 的 意图 状态 。 具 体 而 言 ， 即 表示 针对 所 涉及 的 
每 个 规划 以 及 所 执行 的 任务 ， 智 能 体 所 处 的 状态 。 因 此 ， 每 个 元 素 都 具有 程序 表 
示 的 意图 。 

定义 5.3 (规划 基 ) 一 个 智能 体 的 规划 基 是 一 组 由 规划 P、 任 务 r 和 状态 z 
组 成 的 三 元 组 (p，r，z) 。 智 能 体 的 规划 基 由 PBase(a) 表示 。 

WR (p, T, z) 是 对 于 智能 体 a 的 PBase(a) 中 的 一 个 元 素 ， 则 称 参 与 p 
(或 执行 p) 的 a 应 执行 任务 7 并 处 于 状态 z。 一 个 智能 体 不 能 随意 参与 规划 ， 而 
只 能 在 某 一 时 刻 执行 规划 中 的 一 个 任务 ， 同 时 只 能 执行 规划 类 型 中 的 一 个 规划 。 
另外 ， 智 能 体 只 能 执行 相应 规划 中 的 任务 ， 并 处 于 该 任务 内 的 可 达 状 态 。 这 种 限 
制 称 为 规划 基 公 理 。 

定义 5.4 ”规划 基 公理 集 3, 包 含 以 下 内 容 : 

(p, T, z) ePBase(a) \(p, 7’, 2’) e PBase(a)—>r =7 Az =z’ (5.1) 

(p, T, z) e PBase(a) A(p’, 7’, z') e PBase(a) ApePAp'eP—>p=p' (5.2) 
(p, T, z) e PBase(a)—7 e Tasks(p) Aze States(p) Az e Reachable(p, 7) 
(5.3) 


40 自主 移动 机 器 人 行为 建 模 与 控制 


在 此 ， 定 义 以 下 反映 规划 基层 次 结构 的 宏 : 

定义 5.5 ”Plans' (1, z) 表示 智能 体 在 状态 z 下 规划 基 为 Y 时 所 执行 的 规划 
集 。 可 定义 为 最 小 集 ， 使得: 

@ pePlans’ (Y, z) + (p, 7’, 2’) eT Ape Plans(z) 

@ pePlans’ (Y, z) p'e Plans’ (Y, z) 人 (DT 2’) eY Ape Plans(z’) 
A(p, T, “) er 

在 实现 层面 上 ,规划 基 可 采用 一 个 结构 而 非 集合 来 表示 。 利 用 一 种 图 结构 可 
更 快捷 地 执行 规则 集 。 根 据 规 则 ， 单 个 实例 的 复杂 度 为 0(1) 或 0(n)， 而 非 
O(n’), ， 其 中 为 规划 基 中 三 元 组 的 个 数 。 在 5. 14 节 中 ， 将 会 表明 若 pALICA 程 
序 结构 良好 ， 则 规划 基 总 是 可 构成 一 个 树 结 构 ， 该 特性 进一步 简化 了 程序 的 运行 
时 表示 。 在 此 ， 假 设 采 用 一 种 可 更 直观 描述 语义 而 不 侧重 于 效率 的 集合 表示 。 在 
第 7 章 ， 将 详细 讨论 其 具体 实现 。 
5.2.2 信念 基 

信念 基 表 示 一 个 智能 体 关 于 环境 的 内 部 模型 ， 其 中 包括 对 于 执行 同一 规划 的 
协调 合作 智能 体 的 信念 。 E ALICA 中 ， 利 用 条 件 和 效用 以 L( Pred，Func) 形式 
进行 表示 。 由 此 ，ALICA 应 对 有 关 团 队 成 员 的 信念 表示 进行 某 些 假设 。 

设 C(Pred，Func) 为 信念 基 的 语言 。C 为 对 于 .4 中 每 个 智能 体 a， 由 模 态 算 
F Bel, 和 K, 扩 展 的 一 阶 逻辑 © 。 

算 子 Bel, 表 示 智 能 体 a WMA La. Bel, 表示 智能 体 a 信念 为 $6。 根据 
Fagin 等 人 提出 的 知识 公理 ，Bel 可 由 以 下 公理 定义 (如 KD45 系统 ) : 

© Bel, (dy) — (Bel,g$—Bel,y) (人 分配 公 理 ) 

© Bel. 和 一 ”Bel. p (一 致 性 公理 ) 

@ Bel,$ 一 Bel,Bel,p$ (肯定 自省 公理 ) 

© ~ Bel, b—Bel, > Bel, (否定 自省 公理 ) 

© (Vx)Bel,p (x) —Bel,(( Vx) p (x)) (知识 量词 ) 

这 些 公理 形成 强 理性 信念 的 概念 。 模 态 天 将 Bel 向 知识 扩展 : K, = 
(Bel,$) Ad. 

在 个 体 信念 的 基础 上 ， 利 用 了 “人 人 信念 ” (EBel) 和 共同 信念 ( MBel ) 
的 常用 概念 。 人 人 信念 由 下 式 定义 ( 引 自 Rao 等 人 相关 研究 ” ) : 

EBel, 中 = (VaeA) Bel, 

4 AAS A 中 所 有 智能 体 a 的 信念 均 为 $4， 才 满 足 公式 EBel, ob. p 的 共同 信 

念 定义 为 4 中 所 有 智能 体 a 的 信念 均 为 由 且 共 同 信 念 。MBel 可 正式 定义 为 


”原则 上 ， 由 于 条 款 (ground terms) WAR, ALICA 还 可 工作 于 命题 式 模 态 逻辑 。 


MBel,@ = EBel,@ A EBel, MBel,b 
的 最 大 固定 点 。 
由 此 可 得 到 一 个 无 穷 组 合 形式 : 
MBel, d> EBel, p A EBel, EBel,d A + 入 EBel…EBel 中 人 -… 
用 文字 可 表述 为 ， 人 人 信念 信任 人 人 信念 $ 信任 人 人 信念 信任 人 人 信念 $ 等 。 

L£(Pred, Func) 中 包括 ALICA 的 某 些 特定 项 ， 如 对 于 / A 中 每 个 智能 体 的 常 
数 ， 以 及 特定 域 的 项 ， 如 坐标 或 表示 实际 物体 的 项 。C(Pred，Func) 中 的 各 项 
由 下 式 正 式 表示 : 

@ 一 个 可 数 无 穷 的 变量 集 , X= |x Xa, e, Xp e] 

@ 一 个 风 元 图 数 符号 (n=0) Func, 0 元 函数 符号 称 为 常数 。 Func 包括 : 

>A, B; Z, P.T, R; 

> 函数 符号 的 特定 域 集合 ，F,,,,。 

为 将 程序 执行 中 其 他 智能 体 的 状态 反映 在 信念 基 中 ， 需 引入 下 列 谓词 
( predicate ) ; 

@ In(a, p, T, z), 4AM4(p, 7, z) e PBase(a) 时 满足 。 这 使 得 智能 体 
可 推理 对 其 他 智能 体内 部 状态 的 信念 。 Bel,In(b, p, T, z) 表示 a 认为 6 将 
执行 规划 p 中 的 任务 7 VAR b 正 处 于 状态 z。 根 据 规划 基 公 理 3,， 具 有 信念 基 的 In 
(a, p, T, z) 与 规划 基 中 相应 的 规划 一 任务 一 状态 三 元 组 以 同样 方式 受 限 。 

@ HasRole(c，r) ， 表 示 智 能 体 a 具有 角色 r。 

@ Succeeded(a, p, 7)， 当 且 仪 当 智 能 体 a 成 功 完 成 规划 p 中 的 任务 7 时 
为 真 。 

对 于 L( Pred, Func) 的 谓词 集合 ,假设 Pred 已 包含 这 些 谓词 。 另 外 ， 由 于 
基于 规则 的 ALICA 程序 执行 需要 额外 的 状态 信息 ， 则 假设 一 组 额外 谓词 PA 
Pred 的 子 集 。5. 13 节 中 介绍 的 操作 语义 假设 具有 Pa, 中 的 下 列 谓词 : 

@ Handle/(5b5，z) ， 智 能 体 可 处 理 状态 z 中 行为 b 的 失败 时 满足 。 

@ Handle,(p) ， 智 能 体 可 处 理 规 划 p 的 失败 时 则 为 真 。 

@ Failed(p，i) ， 表 示 规 划 p 失败 i 次 。 

@ Failed(b, z, i), RATA b ERA z RIM i Ko 

@ Alloc(z) ， 当 上 且 仅 当 对 于 状态 z 下 的 智能 体 分 配 任务 必要 时 为 真 。 

© Success(b) 和 Failed (b) 表示 行为 上 的 成 功 或 失败 标志 ， 如 4.1 节 中 
所 述 。 

最 后 ，P,,, 中 包含 有 关 智 能 体 环境 表示 的 谓词 ， 如 DistanceTo( object, dist) 
或 Carries( agent，object)。 在 此 引入 的 语言 元 素 使 得 智能 体 可 推理 环境 ae 
Ps 和 Pi 中 的 符号 ) 以 及 自身 和 彼此 的 内 部 状态 。 这 样 相 对 于 智能 体 的 信念 
可 对 角色 分 配 等 进行 计算 。 


42 自主 移动 机 器 人 行为 建 模 与 控制 


为 反映 描述 有 关 智 能 体内 部 状态 信念 的 不 同 谓词 之 间 的 关系 ， 在 此 定义 了 一 
组 公理 3,。 

定义 5.6 ” 设 对 于 4A 中 智能 体 a，3, 中 包含 下 列 公理 : 

o 智能 体 、 行 为 、 规 划 、 状 态 、 任 务 和 角色 的 唯一 命名 公理 : UNA (A, B, 
Py ZT, BR 

o 如 果 需 要 对 规划 失败 进行 处 理 ， 则 

(Bel,Handle,(p) V Failed(p, i))—>(p =p V(dp', 7, z)In(a, p’, 7, z) A 
p © Plans(z) ) 

o 同 理 ， 如 果 需 要 对 行为 失败 进行 处 理 ， 则 

(Bel, Handle,(b, z) V Failed(b, z, i))—( dp, 7r)In(a, p, T, z) 

e 只 要 有 另 一 个 智能 体 仍 处 于 相应 规划 的 状态 中 ， 则 智能 体 成 功 完 成 任务 : 

Succeeded(a, p, 7)—( dz)pePlans(z) A( da’, 7’, p')In(a’, p’, 7’, z) 

o 只 需 对 智能 体 所 处 状态 进行 任务 分 配 ， 则 

(Bel, Alloc(z) )—( dp, r)In(a, p, T, z) 
定义 5.7 (共同 知识 ) 设 2 为 由 以 下 给 定 的 集合 : 
Bia = Deyn U Biom U Zo UZ, 
式 中 Zu 一 一 一 组 描述 域 的 特定 域 公理 ; 
3, 一 一 根据 定义 5.6 给 出 的 一 组 信念 基 公 理 ; 
3, 一 一 语法 约束 集 ( 见 4.5 节 ); 
5 根据 定义 5.4 的 规划 基 公理 集 。 

5 假设 为 4 中 的 共同 知识 ， 即 满足 3 A MBel .43s。 

定义 5.8 (信念 基 ) 一 组 公式 BCL (Pred, Func) 是 针对 智能 体 的 一 个 信 
念 基 ， 当 且 仅 当 

ZUBI AL 
以 及 
In(a, p, T, z) eBoO(p, t, z) EPBase(a) 

这 样 ， 一 个 智能 体 的 信念 基 反 映 了 对 环境 的 信念 以 及 对 所 有 其 他 智能 体内 部 
状态 的 信念 〈 即 规划 基 ) 。 上 述 定义 产生 一 个 反映 智能 体 总 是 相信 其 意图 所 做 行 
为 的 信念 基 。 另 外 ， 相 对 于 ;， 信 念 基 总 是 保持 一 致 。 用 BelBase(a) 表示 智能 
I% a 的 信念 基 。 

定义 5.9 (智能 体 证 明 ) ia 为 一 个 智能 体 ， 天 为 C 中 的 一 组 公式 ，7 为 一 
个 替换 ， 几 为 一 个 公式 。 相 对 于 上 和 Zr ， 用 下 式 表示 证 明了 小: 

三 He 中 


式 中 “7 一 一 证 明 的 计算 答案 。 
如 果 内 容 清 楚 ， 则 可 忽略 a、L 或 7。 
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证 明 算 子 上 是 指 逻辑 Z 中 定理 证 明 算 法 ， 且 相对 于 域 可 互 换 。 
5.2.3 信念 更 新 
智能 体 的 信念 基 不 断 更 新 ， 以 适应 新 的 感知 数据 、 通 信行 为 或 内 部 状态 更 
新 。 在 此 ， 仅 分 析 最 后 一 种 情况 。 记 下 + 下 表示 信念 基 有 由 下 = {fi, hs ns 
f 的 (有 限 ) 集 进 行 更 新 : 
BF =B4 N 
B-F =B+ A af 
要 求 信念 更 新 算 子 + 满足 KM 假设 “1U1 ~ U4 和 U8， 以 适用 于 静态 共同 知 
识 &y ， 从 而 + 构成 一 个 基本 的 惯性 更 新 算 子 参见 Lang 相关 研究 ) : 


EsU(B+/) | =f (U1) 

E UBI =f>(B+f)-B (U2) 

如 果 ;UB 和 f 均 满足 ， 则 5sU (B+f) 也 满足 (U3) 
WR BOC, 以 及 frrg, M) B+f>C+g (U4) 
(BUC) +fe(B+f) U(C +f) (U8) 


最 重要 的 是 ， 信 念 基 必 须 在 任何 时 候 都 一 致 。 注 意 到 ， 相 对 于 3,， 可 通过 去 
除 Handle, (p, z), Handle, (b), Failed(p, i), Succeeded(a, p, T), Alloc (z), 
Success(b, z) #il Fail(b, z) 来 达到 一 致 性 。 

例如 ， 假 设 一 个 智能 体 a 执行 一 个 规划 p， 因 此 In(a, p, t, z) 在 
BelBase(a) 中 满足 。 现 在 ， 由 于 更 高 层 规划 的 作用 ， 智 能 体 放 弃 执 行 p。 则 更 
新 BelBase(a); BelBase(a)’ =BelBase(a) -In(a, p, 7, z)o fan, WRX F 
状态 z， 所 有 分 配 都 有 待 进行 ，Alloc (z) e BelBase(a), ， 则 不 再 相关 ， 因 此 
Alloc(z) 也 会 被 去 除 。 
5.2.4 执行 集 

智能 体 的 执行 集 瑟 满足 (2，z) IW, H b 为 行为 ,，z 为 状态 ,使 得 b 在 z 
中 发 生 (be Behaviours(z) ) 。 将 状态 z 称 为 上 的 文 义 。 可 将 五 传递 到 执行 行为 底 
层 的 软件 组 件 。E 中 所 包含 的 内 容 允 许 行 为 查询 具有 相应 规划 、 状 态 或 任务 的 智 
能 体 的 信念 基 。 操 作 语 义 必须 保证 如 果 (b5，z) 在 a 的 执行 集中 发 生 ， 存 在 规划 
p 和 任务 7 使 得 (p，+，z) 是 其 规划 基 的 一 个 元 素 ， 从 而 使 得 a 信念 In(a, p, 
T, z)o 5.14 节 将 阐述 该 特性 。 
5.2.5 角色 集 

一 个 智能 体 的 角色 集 RCR 是 由 智能 体 当 前 履行 的 所 有 角色 组 成 的 ， 由 此 满 
足 Bel,HasRole(a, r) reR。 角 色 由 角色 分 配 算 法 分 配 ， 并 给 出 智能 体 执 行 任 
务 的 优先 权 。 该 两 层 方法 简化 了 任务 分 配 问题 。 另 外 ， 利 用 角色 和 任务 解 耦 
智能 体 和 规划 ， 使 得 规划 设 定 与 团队 组 成 相互 独立 进行 ， 这 通常 在 开发 阶段 是 完 
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全 未 知 的 。 通 常 ， 角 色 分 配 的 全 局 最 优 解 是 NEXP 时 间 完 备 的 ” 。5.6 节 中 给 
出 了 一 类 简化 问题 的 实际 解决 方案 。 


5.3 局 部 性 


若 允 许 规 划 中 出 现任 意 条 件 ， 则 与 5. 1 节 中 所 定义 局 部 性 原则 产生 冲突 。 
因此 限制 出 现 谓 词 In(a, p，+,，z)， 这 样 智能 体 就 只 能 参考 其 自身 的 局 部 
角度 。 

定义 5.10 ” 当 且 仅 当 对 于 $$ 中 所 有 的 谓词 In(a, p, T, z), p 为 恒定 规划 
p, WARP p 对 规划 p 而 言 是 局 部 规划 。 

定义 5.11 局 部 性 规定 : 所 有 作为 规划 的 前 置 条 件 或 运行 时 条 件 的 公式 ， 
都 是 各 自 规划 的 局 部 规划 。 

该 定义 比 需 要 强制 执行 的 局 部 性 原则 有 些 严 格 。 正 如 现在 这 样 ， 在 其 他 规划 

完全 禁止 涉及 智能 体 ， 可 保证 每 个 规划 便于 在 其 他 情况 下 重用 ， 这 是 一 个 对 于 
规划 算法 以 及 非常 复杂 的 ALICA 程序 的 系统 设计 非常 有 用 的 特性 。 另 外 ， 正 如 
将 在 5. 12 节 中 所 述 ， 该 定义 还 允许 规划 的 任务 分 配 计 算 与 其 旁 支 和 子规 划 均 独 
六， 由 此 极 大 简化 了 任务 分 配 问题 。 

注意 到 ， 并 不 仅 限 于 谓词 Succeeded(a, p, r) 和 Failed(p, i), tH HF 
其 他 规划 。 因 此 ， 规 划 可 在 特定 情况 下 对 子规 划 的 成 功 终止 或 失败 终止 做 出 反 
应 ， 另 外 转移 条 件 也 不 受 限 。 因 此 可 在 子规 划 中 实现 任意 转移 ， 从 而 产生 了 一 些 
将 在 10. 1 节 中 讨论 的 建 模 模式 。 由 于 转移 与 求解 任务 分 配 问 题 不 相关 ， 因 此 不 
会 产生 任何 问题 。 行 为 条 件 可 分 别处 理 ( 见 5.7 节 )。 


5.4 团队 配置 


在 由 谓词 h(a, p, r, z) 在 信念 基 中 表示 的 执行 规划 的 智能 体 概念 基础 
上 ， 引 入 执行 规划 的 团队 概念 。 在 ALICA 中 ， 相 对 于 所 参与 的 规划 ， 每 个 智能 
体 不 断 监测 其 团队 成 员 的 动作 。 因 此 ， 一 个 智能 体 不 仅 可 对 智能 体 失控 ， 并 随后 
从 团队 中 去 除 做 出 反应 ， 而 且 每 个 智能 体 在 决策 时 ( 如 执行 规划 中 的 一 个 任务 ) 
还 可 考虑 所 有 其 他 智能 体 的 进展 。 注意 到 ， 由 于 局 部 性 原则 ， 对 于 没有 参与 的 规 
划 ， 智 能 体 不 能 推断 团队 状态 。 

定义 5.12 ia 为 4 中 的 一 个 智能 体 ，TeamIin(4，p) 表示 执行 规划 p 的 团 
队 4CA， 则 可 表示 为 


TeamIn(A, ih sk VreTasks(p))( dn,, n)E(p, 7) =(n,, nm) A 


CIPA CANAM <1 Al Sa, A 
(Va'’eA)a’ &A's>*( 4z)In(a’, p, T, z) VSucceeded(a', p, 7) 
如 果 4=.4， 可 将 TeamIn(A, p) 简写 为 TeamIn(p)。 
定义 5. 12 反映 了 执行 规划 的 一 个 团队 的 最 重要 概念 。 在 具有 两 个 4 AIA’, 
HLA'DA, (4% TeamIn(A, p) FI TeamIn(A’, p) 的 意义 上 ， 这 是 非 单调 的 。 
因此 ， 就 智能 体 团 队 而 言 ， 智 能 体 的 信念 对 规划 的 评估 具有 重要 作用 。 注 意 到 ， 
该 定义 还 需 考 虑 任务 的 成 功 完成 。 


5.5 成 功 语义 


根据 域 的 不 同 ， 某 些 行为 和 任务 可 以 完成 ， 即 存在 一 个 可 实现 的 明确 目标 描 
述 。 一 旦 智能 体 达 到 目标 描述 要 求 ， 则 认为 已 完成 行为 或 任务 ， 且 该 智能 体 可 自 
由 地 去 做 其 他 工作 。 对 于 一 个 行为 而 言 ， 可 通过 表示 达到 行为 后 置 条 件 的 谓词 
Success(b) 来 表明 成 功 。 一 个 完成 规划 p 中 任务 7 的 智能 体 a 增强 了 Succeeded 
(a, p, 7) 的 信念 。 如 定义 5. 12 中 所 示 ， 任 务 成 功 完成 会 影响 智能 体 如 何 考虑 
关于 相应 规划 的 团队 状态 。 

在 不 同 场景 中 ， 还 应 关注 整个 规划 是 否 成 功 ， 而 不 是 单个 任务 ， 然 而 智能 体 
成 功 完成 一 个 任务 并 不 足以 得 出 相应 规划 也 成 功 的 结论 。 实 际 上 ， 规 划 的 成 功 与 
否 取 决 于 任务 的 状态 。 由 于 规划 的 某 些 任务 可 选 ， 因 此 需要 一 个 新 的 定义 来 反映 
规划 成 功 与 任务 成 功 之 间 的 关系 。 

例如 ,考虑 任务 是 将 某 个 设备 搬运 通过 未 知 区 域 的 一 组 机 器 人 。 需 要 某 些 机 
器 人 在 前 方 搜索 来 寻找 最 佳 路 线 以 避免 搬运 设备 时 经 过 不 必要 的 路 程 。 然 而 如 果 
只 有 少数 几 个 机 器 人 ， 则 为 了 都 用 于 搬运 机 器 人 而 忽略 搜索 环节 。 因 此 即使 没有 
机 器 人 完成 搜索 任务 ， 规 划 仍 是 成 功 的 。 

定义 5. 13 “对 于 一 个 规划 ， 任 务 可 能 是 可 选 的 也 可 能 是 必须 完成 的 。 在 此 ， 
将 规划 p 所 需 的 任务 集 记 为 Required(p)。 若 对 于 规划 所 需 的 所 有 任务 ， 成 功 完 
成 任务 的 智能 体 个 数 最 少 ， 则 认为 规划 是 成 功 的 : 


Sueeseded(p) = ( Yre Required (p))( dn, n', m) é (p, rT) =(n, m) 
An'=max(1, n) A\n’<llalSucceeded(a,p,7)!| 
因此 ， 对 于 规划 所 需 的 任何 任务 ， 能 执行 该 任务 的 智能 体 也 必须 是 完成 该 任 
务 个 数 最 少 的 智能 体 。 在 最 小 基数 为 零 时 ， 至 少 需要 一 个 智能 体 来 完成 任务 。 
再 次 考虑 上 述 搬运 场景 的 例子 。 在 智能 体 的 搬运 路 径 上 可 能 存在 废墟 。 通 过 
利用 零 最 小 基数 ， 可 使 得 所 有 智能 体 先 放下 设备 ， 在 另 一 个 任务 中 清除 废 坟 ， 然 
后 在 不 放弃 规划 执行 的 条 件 下 继续 搬运 。 
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例如 ， 如 果 规 划一 任务 对 (P，r) 的 基数 为 (2，4) ， 这 意味 着 对 于 要 完成 
的 规划 p， 必 须 至 少 有 两 个 智能 体 来 执行 任务 r， 当 然 实 际 执行 任务 的 智能 体 个 
数 可 以 更 多 。 尽 管 一 开始 必须 至 少 有 两 个 智能 体 来 执行 任务 7 以 满足 TeamIn 
(p)， 但 对 于 完成 任务 的 智能 体 ， 这 并 非 必要 条 件 。 

在 智能 体 正 在 完成 一 个 规划 时 ， 并 不 需要 一 次 完成 所 有 任务 。 实 际 上 ， 某 些 
任务 可 能 会 较 早 完成 ， 这 时 相应 的 智能 体 可 自由 地 去 做 别 的 工作 。 给 定 一 个 信念 
Se, PRE: PxT x24Nox (NoU {o}) 反映 了 当前 所 需 的 规划 基数 : 

(n, m) T ¢ Required(p) 
Elp, T, B) E n-c), max(0, m-c)) 其 他 
式 中 é(p, 7, B) = (n, m); 

c=1|{alSucceeded(a,p,7) €B} |. 

在 5.8 节 讨 论 的 任务 分 配 中 ， 利 用 了 以 ,反映 的 所 需 智 能 体 的 概念 。 

根据 信念 公理 3,， 直 到 所 有 智能 体 都 完成 相应 规划 ,任务 的 成 功 才 有 效 。 
如 果 智 能 体 已 完全 完成 一 个 规划 ， 而 又 在 后 来 的 某 段 时 间 内 重新 执行 该 规划 ， 则 
必须 再 次 完成 该 规划 ， 即 认为 第 二 次 执行 该 规划 是 针对 一 个 新 的 问题 。 否 则 一 旦 
完成 规划 ， 则 再 也 不 能 执行 ， 直 到 通过 某 些 其 他 方法 重 置 智能 体 。 


5.6 角色 分 配 


在 4.4 节 中 ,介绍 了 角色 的 基本 概念 。 现 在 讨论 一 种 为 智能 体 分 配角 色 的 方 
法 。Campell 和 Wu” 对 目前 已 有 的 角色 分 配 算法 进行 了 详细 的 综述 。 在 此 ， 并 
不 讨论 角色 分 配 算法 的 研究 现状 ， 而 是 通过 实例 来 前 述 如 何 将 现 有 方法 集成 到 
ALICA 中 。 

类 似 于 Vail 和 Veloso ™ ， 在 此 采用 一 种 广播 计算 方法 ， 其 中 智能 体 广播 有 
关 角 色 分 配 的 信息 ， 并 对 分 配 进 行 局 部 计算 ， 由 此 得 到 较 高 反应 性 的 分 配 。 人 然而 
与 上 述 方法 相 比 ，ALICA 中 的 角色 相对 固定 ， 这 是 由 于 其 不 依赖 于 域 的 高 动态 
特性 ， 如 机 器 人 位 置 或 其 他 感 兴趣 的 物体 。 实 际 上 ， 这 仅 取 决 于 智能 体 的 个 数 和 
能 力 。 任 务 分 配 所 反映 的 更 多 动态 特性 ， 将 在 5. 8 节 中 讨论 。 

为 给 智能 体 分 配角 色 ， 需 要 一 个 表示 智能 体 对 某 一 角色 充分 性 的 量度 ， 即 角 
色 效 用 ， 该 效用 可 分 别 由 角色 和 智能 体 所 需 的 和 所 提供 的 能 力 来 确定 。 假 设 一 个 
相似 性 度量 A: CxC [0, 1], 使 得 A(x, x) =1, A(x, x) =0, Hepa RAR 
x 的 补 。 这 种 基于 模糊 集 的 量度 可 参见 参考 文献 [186]. 

定义 5.14 ”( 角 色 效 用 ) 对 于 某 一 角色 r*>， 某 一 智能 体 a 的 效用 WU(a，r) 
是 基于 智能 体 的 能 力 Cap(a) 和 角色 所 需 能 力 Cap(r) 之 间 的 相似 性 A。 这 些 值 
的 归 一 化 之 和 反映 了 智能 体 对 于 某 一 角色 的 效用 : 


BS m x 47 


0 ( dee Cap(r) ) 
MAX,” e Capta) A(c,c') =0 
U(ar)=1 1 l 
|Cap(r) | È ce cap(r) MAX, e Capa) Å CC ) Cap(r) #0 


1 其 他 

也 就 是 说 ， 所 需 的 每 个 能 力 都 与 智能 体 的 能 力 最 佳 匹配 。 

给 定 角 色 效 用 ， 可 定义 一 个 对 团队 中 所 有 智能 体 分 配角 色 的 角色 分 配 过 程 。 
假设 该 过 程 由 一 个 队 形 封装 。 

定义 5.15 ”对 于 一 个 给 定 的 ALICA 程序 ， 用 下 表 示 队 形 。 队 形 中 包含 特定 
的 角色 分 配 算法 以 及 角色 分 配 计算 所 需 的 任何 信息 。 角 色 分 配 是 由 (4) 计算 
的 形式 为 HasRole(a,r) 的 一 组 信念 ， 其 中 4 为 智能 体 集合 。 

一 个 简单 有 效 的 队 形 可 由 优先 级 列表 描述 。 优 先 级 列表 定义 了 RR 中 所 有 角色 
实例 的 总 排序 ， 并 根据 总 排序 为 最 适合 的 智能 体 分 配 最 重要 的 角色 。 表 5. 1 给 出 
了 相应 的 算法 。 在 这 种 特定 情况 下 ， 如 果 智 能 体 个 数 多 于 角色 个 数 ， 则 算法 从 其 
余 智 能 体 开始 执行 。 另 外 还 要 注意 , 0 值 用 于 表示 智能 体 没 有 能 力 来 担任 某 一 特 
定 角色 ， 即 表示 该 智能 体 缺乏 特定 能 力 。 


R51 基于 优先 级 的 角色 分 配 


A : = set of available agents ; 
R ; = non—empty sorted list of roles according to their priority ; 
i = 
j: =0; 
while (A # Ø) | 
a: = argmax, eaU (a,r [i]); 


if (U (a,r [i]) > 0) | 
assign a to role r [i]; 


remove a from A; 


j: = 0; 

| else j+ +; 

i: = (i+l) mod! RI ; 
if( j = | RI ) return FAILURE; 


| 


在 机 器 人 足球 领域 ， 角 色 实 例 的 一 个 合适 列表 可 能 为 
R = ( Attacker, Goalie, Defender, Attacker, Defender, Supporter) 
这 描述 了 首先 需要 一 个 进攻 机 器 人 ， 然 后 是 守门 员 和 防守 机 器 人 。 如 果 还 有 另外 
的 机 器 人 ， 再 分 配 第 二 个 前 锋 和 第 二 个 后 卫 ， 然 后 是 中 场 。 这 时 ， 能 力 是 表示 只 


48 自主 移动 机 器 人 行为 建 模 与 控制 


有 尺寸 较 大 的 机 器 人 可 担任 守门 员 和 角色， 而 能 踢 球 的 机 器 人 作为 前 锋 。 如 果 由 于 
丧失 能 力 而 导致 一 个 机 器 人 不 能 分 配角 色 ， 则 在 对 所 有 可 担任 角色 的 机 器 人 分 配 
之 后 ， 算 法 也 是 失败 的 。 

最 先进 的 技术 可 处 理 每 个 角色 的 基数 ， 并 考虑 相互 关联 的 效用 。 但 由 于 该 问 
题 与 5. 8 节 所 讨论 的 任务 分 配 问题 类 似 ， 故 在 此 不 予 讨论 。 值 得 注意 的 是 角色 分 
配 仅 依赖 于 智能 体 的 个 数 和 能 力 ， 因 此 仅 只 需 计 算 上 述 发 生变 化 的 事件 ， 如 智能 
体 丧 失 能 力 或 团队 中 新 增 一 个 智能 体 。 

该 方法 集成 了 可 检测 智能 体 或 机 器 人 故障 组 件 的 监测 设备 。 这 种 情况 下 ， 角 
色 分 配 可 对 刚 丧 失 的 或 退化 的 能 力作 出 反应 ， 并 为 损坏 的 机 器 人 分 配 一 个 不 太 重 
要 的 角色 。Weber 和 Wotawal ”提出 了 一 种 类 似 方 法 。 在 5. 13 节 中 提供 了 一 种 
将 角色 分 配 集成 到 ALICA 运行 时 语义 的 操作 规则 。 


5.7 正则 行为 规划 


行为 是 所 构 ALICA 程序 中 的 核心 基 元 〈 原 语 ) 。 协 调和 合作 依赖 于 哪个 智能 
体 执行 何 种 行为 的 准确 信息 ， 以 及 该 信息 是 显 式 表示 还 是 隐 式 表示 。 在 ALICA 
H, 行为 封装 了 不 可 分 的 动作 程序 ， 将 其 看 作 一 个 由 前 置 条 件 、 后 置 条 件 和 运行 
时 条 件 注释 的 黑 盒 。 与 规划 不 同 ， 在 此 没有 引入 反映 智能 体 是 否 执行 行为 的 信 
念 ， 由 此 智能 体 就 不 能 直接 推理 另 一 个 智能 体 所 执行 的 行为 ， 但 是 智能 体 可 推理 
相应 的 更 高 层 结 构 的 规划 。 当 行为 由 只 有 一 个 局 部 智能 体 评 估 的 关键 前 置 条 件 和 
运行 时 条 件 注释 时 ， 这 种 不 同 显 而 易 见 。 

通过 引入 表示 行为 执行 的 正确 信念 可 缩小 之 间 的 差别 ， 然 而 这 种 信念 会 使 得 
操作 语义 不 必要 的 复杂 化 ， 由 此 导致 可 读 性 变 差 。 然 而 值得 注意 的 是 ， 行 为 可 艇 
入 到 反映 行为 条 件 的 规划 中 ， 因 此 可 挂 起 行为 使 得 团队 可 推理 和 交流 个 体 智能 体 
和 特定 行为 之 间 的 关系 。 

这 种 戏 入 必须 保证 每 当 规划 执行 时 ， 同 时 也 执行 行为 。 通 过 对 每 个 行为 均 产 
生 一 个 规划 和 一 种 规划 类 型 ， 可 自动 实现 上 述 般 人 。 具 有 包含 行为 和 终止 状态 的 
两 种 状态 的 规划 可 实现 一 个 简单 的 嵌入 ， 在 此 将 这 种 简单 谋 入 称 为 行为 的 一 个 正 
则 规划 。 

定义 5.16 (正则 规划 ) 行为 b 的 一 个 正则 规划 p, 由 下 列 结构 定义 : 

@ States(p,) = | z,, z | 5 

@ Tasks( (p,) = {To} o 

@ Init(p,, To) =Z,o 

® é(p,, To) =(0, ©), 

@ Pre(p,) =Pre(b), Run(p,) =Run(b) A> Fail(b) 。 


© U(p,)(B) =1. 

@ PlanTypes(z,) =Ø., 

@ Behaviours(z,) = |b}. 

@ Ws (z,, z}, Succeeded(b)). 

® Success(p,) = |z}, Fail(p,) =Ø. 

@ Post(z,) = Post(b), 

@ Required(p,) = {79} o 

正则 规划 是 相应 正则 规划 类 型 的 单一 元 素 : 

定义 5.17 (正则 规划 类 型 ) 行为 b 的 一 个 正则 规划 类 型 P, 正 好 包含 5 的 正 
则 规划 ，P， = {pst o 

假设 每 个 行为 都 戏 人 在 一 个 正则 规划 中 ， 就 单独 考虑 行为 条 件 而 言 ， 智 能 体 
是 完全 自由 的 ， 这 就 足以 考虑 规划 条 件 。 在 可 能 需要 采用 实现 附加 结构 的 其 他 髓 
入 时 ， 这 将 不 会 产生 额外 的 表现 力 。 因 此 ， 接 下 来 假设 每 个 行为 只 在 其 正则 规划 
中 发 生 。 


5.8 任务 分 配 


多 智能 体 协调 合作 的 一 个 最 核心 的 问题 就 是 任务 分 配 ”。 在 ALICA 中 ， 
该 问题 是 由 从 规划 类 型 中 选择 一 个 规划 并 在 所 选 的 规划 中 对 智能 体 分 配 任务 定义 
的 。 由 于 ALICA 允许 每 个 任务 可 具有 多 个 智能 体 ， 因 此 该 问题 是 NP 难题 |。 
与 Nair 等 人 "'™ 提出 的 任务 分 配 算法 不 同 ， 可 能 涉及 的 每 个 规划 的 效用 函数 取决 
于 完全 分 配 ， 这 样 在 完全 分 配 未 知 的 条 件 下 ， 就 无 法 计算 每 个 智能 体 的 效用 
函数 。 

每 当 智 能 体 进 入 一 个 状态 ， 就 会 产生 任务 分 配 问题 。 此 时 ， 必 须 对 该 状态 下 
所 有 规划 类 型 进行 决策 ， 应 执行 哪个 规划 ， 以 及 如 果 可 能 应 执行 哪个 任务 。 也 就 
是 说 ， 必 须 对 所 有 参与 的 智能 体 进行 任务 分 配 的 计算 。 按 照 保 证 快速 反应 的 广 
播 一 计算 方法 ， 智 能 体 根据 其 当前 信念 来 计算 任务 分 配 。 理 想 情 况 下 ， 每 个 参与 
的 智能 体 都 计算 同一 任务 分 配 ， 然 而 这 不 能 完全 保证 ， 因 为 参与 的 智能 体 可 能 具 
有 影响 计算 结果 的 不 同感 知 数据 。ALICA 执行 弱 承诺 思想 。 假 设 不 断 修 正 所 计 
算 的 分 配 ， 直 到 产生 相互 矛盾 的 信息 。 第 6 章 将 主要 讨论 如 何 修 复 分 配 以 及 冲突 
消解 。 

对 于 规划 p， 其 任务 分 配 C 是 一 组 谓词 m(a，p，7，z) ， 对 p 中 积极 参与 的 
每 个 智能 体 a; 进 行 分 配 。 对 于 任务 分 配 C 中 的 每 个 In(a;, p, T, z), 7 为 与 p 
相关 的 任务 ， 即 Tasks(p) 中 的 一 个 元 素 , z 是 P r 的 初始 状态 mit(p，7) 。 在 
没有 一 个 参考 框架 下 ， 无 法 进行 任务 分 配 计 算 。 通 常 将 问题 域 的 情况 作为 参考 框 
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架 ， 如 当前 情况 或 规划 假设 的 情况 。 在 此 ， isa Seen gee 5 
信念 更 新 的 概念 一 样 ， 这 组 假设 有 时 也 作为 信念 状态 。 值 得 注意 的 是 ， 这 些 假设 
可 能 包含 In(a, p, T, z) 的 含义 ， i 中 分 配 某 些 任 务 。 

定义 5.18 任务 分 配 C 是 一 组 形式 为 In(a, p, T, 2) 的 基本 信念 。 

定义 5.19 ”在 假设 集合 下 ,规划 p 的 任务 分 配 CAM, SAM: 

© (VYleC)(Ja, r)l=In(a, p, T, Init(p, 7)) Are Tasks(p). 

e 5,UFUCI AL. 

© 5 ,UFUC EFPre(p) A Run(p) ; 

@ >, UF UCt TeamIn(p) . 

@ U(p)(FUC) 20, 

当 且 仅 当 在 假设 上 站 F ，C 为 规划 p 的 一 个 有 效 任务 分 配 ， 宏 TAlloc(p | F) 
(C) 的 定义 才 满 足 。 

根据 该 定义 ,一 个 有 效 任务 分 配 应 符合 ALICA 公理 以 及 相应 情况 政 。 如 果 
在 当前 状态 下 分 配 智能 体 ， 天 就 相当 于 智能 体 的 信念 基 。 因 此 ， 应 首先 考虑 已 
执行 p 中 一 个 任务 的 智能 体 ， 这 样 可 允许 在 某 些 智能 体 退 出 规划 且 需 要 替换 的 
情况 下 进行 动态 修复 。 另 外 ， 该 定义 还 保证 所 分 配 的 规划 能 够 由 智能 体 团 队 正 
确 执行 。 最 后 ， 由 于 需要 一 个 正 效 用 ， 效 用 函数 可 禁止 在 特定 条 件 下 执行 某 些 
分 配 任务 。 

一 个 规划 的 效用 函数 不 仅 表 明了 规划 符合 某 个 特定 情况 的 程度 ， 而 且 还 
应 考虑 任务 分 配 。 因 此 ， 效 用 函数 可 反映 与 Nair 等 人 "所 提 方 法 类 似 的 对 
于 某 些 特定 任务 的 奖励 。 对 于 一 个 分 配 了 规划 p 中 任务 的 智能 体 应 最 大 化 
U(p)(FUC)， 其 中 C 是 一 个 有 效 任务 分 配 ， 为 如 当前 信念 情况 的 假设 。 
换 句 话说 ， 即 计算 

T=argmaxU(p) (FUC) 

在 TAlloe(p1 F)(C) 条 件 下 。 

定义 5.20 在 假设 集合 上 下 ， 对 规划 类 型 P 而 言 ， 一 个 任务 分 配 C 有 效 ， 
当 且 仅 当 P 中 存在 一 个 使 得 TAlloc(p | F)(C) 的 规划 po 

根据 定义 5.20， 规划 类 型 的 一 个 有 效 任务 分 配 也 是 该 规划 类 型 中 所 有 规划 
的 有 效 任务 分 配 ， 从 而 可 从 规划 类 型 中 选择 一 个 规划 。 这 样 就 使 得 优化 任务 还 包 
括 规划 p 的 选择 : 

T = argmaxmaxl(p)(FUC) 

在 TAlloc(p1 F) (C) AFF. 

由 于 只 考虑 了 该 优化 任务 的 有 效 分 配 ， 因 此 在 所 有 情况 下 ， 可 能 不 会 存 
在 解 。 


5.9 递归 式 任务 分 配 


在 任务 分 配 概念 的 基础 上 ， 介 绍 一 种 将 智能 体 分 配给 规划 树 中 一 个 规划 分 支 
的 递归 式 任务 分 配 。 直 观 上 ， 只 要 智能 体 进入 一 个 状态 ， 就 必须 求解 该 状态 内 所 
有 规划 类 型 的 任务 分 配 问题 ， 进 入 该 分 配 所 涉及 的 状态 ， 然 后 还 要 解决 这 些 子 状 
态 中 的 任务 分 配 问题 。 

由 于 ALICA 程序 的 层次 化 结构 特性 ， 递 归 式 任务 分 配 问题 是 ALICA 的 核心 
问题 。 在 5. 13 节 中 ， 将 讨论 在 具有 环境 动态 变化 或 不 可 预见 问题 ( 如 智能 体 损 
TR) 的 执行 过 程 中 ， 如 何 动态 自 适 应 地 进行 任务 分 配 。 这 种 任务 动态 重 分配 需 
要 一 种 实时 产生 最 优 分 配 的 高 效 任务 分 配 算法 。 

下 面 的 示例 展示 了 递归 式 任务 分 配 问 题 ， 并 利用 该 示例 来 讨论 分 配 算法 的 
特性 。 

示例 5.1 一 个 大 型 餐厅 经 理 希 望 使 用 机 器 人 为 顾客 提供 服务 ， 为 此 购买 了 
三 个 服务 机 器 人 ， 分 别 命名 为 a、b 和 c。 对 这 些 机 器 人 制定 了 一 个 项 层 规划 PO, 
其 余 规 划 由 同事 完成 。 图 5. 1 给 出 了 PO 及 其 同事 制定 的 规划 。 为 简单 起 见 ， 每 
个 规划 类 型 仅 包含 一 个 规划 。 这 样 当 执 行 ServeGuests 时 ， 机 器 人 既 可 从 厨房 取 食 
物 ， 并 送 到 餐桌 ( DeliverOrder 任务 ) ， 也 可 服务 顾客 ， 如 果 需 要 的 话 还 要 下 单 
(TaskOrder 任务 ) 。 餐 厅 的 厨师 希望 尽快 将 食物 送出 以 免 变 凉 ， 因 此 要 求 传 递 食 
物 的 机 器 人 应 尽 可 能 多 。 将 上 述 过 程 表示 为 一 个 效用 函数 ， 记 为 


vi( SoreGueatsy = |lalIn(a, Bervetuests , DeliverOrder ,z} | 


| | alIn(a,ServeGuests , TakeOrder,z) } | 
100 


式 中 100 一 一 服务 于 该 餐厅 的 所 有 机 器 人 的 最 大 绝对 值 。 

聪明 的 手下 制定 了 一 个 为 餐桌 传 菜 的 规划 DeliverOrder。 已 知 机 器 人 在 等 待 
下 一 步 任务 时 只 是 在 餐桌 周围 闲逛 ， 并 会 占用 空间 ， 因 此 增加 一 个 前 置 条 件 ， 即 
表示 在 厨房 准备 食物 时 ， 无 需 机 器 人 执行 FetchOrder: 

(4x) 1 In(a, DeliverOrder, Waiter, Z,) | <x A DisherAvail (x) 

现在 ， 考 虑 机 器 人 刚 开 始 工作 ， 且 有 两 道 菜 需 要 服务 (DishesAvail (2) ) 
的 场景 。 对 规划 PO 中 的 状态 Zo 执行 递归 式 任务 分 配 。 最 大 化 规划 ServeGuests 
的 效用 ， 即 规划 类 型 ServeGuestsPT 中 唯一 的 一 个 规划 ， 这 将 对 任务 DeliverOrder 
分 配 所 有 三 个 机 器 人 ， 即 需要 整个 团队 来 执行 任务 DeliverOrder。 然 而 由 于 只 需 
服务 两 道 菜 ， 在 任务 DeliverOrder 中 分 配 三 个 机 器 人 会 与 其 前 置 条 件 产生 冲突 。 
因此 ， 只 能 为 DeliverOrder 任务 分 配 两 个 机 器 人 ， 另 一 个 机 器 人 应 服侍 顾客 ， 并 
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ServeGuests 


DeliverOrder 
1..100 0..100 


ServeGuestsPT={ServeGuestw} 
DeliverOrderPT={ DeliverOrder} 


DeliverOrder 


Pre:(4x) | In(a,DeliverOrder, Waiter,Z3) | 三 xA DishesA vail(x) 


Has order © At table a] Food accepted 


_GoToTable | PutFood | 


1..100 


| FetchOrder | 


图 5.1 任务 分 配 示例 


等 待 下 一 步 命 令 。 

在 上 述 简单 实例 中 ， 对 规划 ServeGuests 中 的 两 个 任务 分 配 三 个 机 器 人 会 产 
H 8 种 可 能 性 。 一 般 而 言 ， 在 具有 个 机 器 人 ，m 个 任务 的 一 个 规划 中 ， 所 有 可 
能 存在 的 分 配 个 数 为 mw ， 这 无 法 快速 地 对 所 有 可 能 性 进行 强制 穷 举 ， 因 此 需要 
一 种 更 有 效 的 方法 。 在 5. 11 节 中 ， 将 讨论 如 何 通 过 构建 效用 函数 来 应 用 如 A * 
法 等 搜索 算法 。 

然而 ， 在 单个 规划 中 机 器 人 的 分 配 只 是 所 研究 问题 的 一 部 分 。 在 该 示例 中 ， 
父 规划 ServeGuests 与 两 个 子规 划 的 分 配 可 相互 作用 。 一 个 可 计算 满足 所 有 条 件 
并 相对 于 所 涉及 效用 函数 最 优 解 的 算法 应 考虑 所 有 参与 规划 的 全 局 问题 ， 这 将 抵 
消 层 次 分 解 在 计算 时 间 上 的 优势 。 另 外 ， 由 于 每 个 智能 体 都 需要 计算 分 配 ， 而 通 
信和 延迟 可 能 太 大 且 通 信 太 不 可 靠 ,使 得 多 个 智能 体 的 复杂 规划 结构 可 有 效 克 服 单 
个 机 器 人 计算 能 力 的 不 足 。 最 后 ， 未 参与 智能 体 无 法 获得 规划 p 中 分 配 决 策 所 需 
的 必要 信息 ， 因 此 认为 全 局 分 配 算法 不 可 行 。 

在 5.1 节 中 ， 引 入 局 部 性 原则 ， 即 要 求 每 个 智能 体 只 考虑 其 所 参与 的 规划 ， 
而 无 需 计算 其 余 未 参与 的 规划 。 根 据 这 一 原则 ， 三 个 智能 体 可 能 分 别 得 出 结论 : 
不 能 对 任务 DeliverOrder 分 配 所 有 三 个 智能 体 。 根 据 智能 体 和 任务 的 总 排序 ， 每 
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个 智能 体 又 都 能 独立 地 得 出 结论 : 智能 体 5 和 < 应 负责 传送 食物 ， 而 智能 体 a 负 
责 下 单 。 智 能 体 和 < 需要 确定 任务 DeliverOrder 的 前 置 条 件 为 真 ， 而 智能 体 a 
无 需 评估 。 图 5.2 表明 了 上 述 情 况 。 其 中 ， 所 有 智能 体 对 分 配方 案 达 成 一 致 ， 并 
实现 协调 合作 。 但 是 如 果 只 需 传送 一 道 菜 呢 ? 这 时 就 只 需 一 个 智能 体 来 执行 任务 
DeliverOrder， 如 图 5.3 所 示 。 


DeliverOrder 


a,b,c 


以 ServeGuests 中 最 大 
效用 函数 进行 分 配 


a,b,c 
TakeOrders 
4 = 
DeliverOrder 
b.c “ 
满足 Pre(ServeGuests) 和 
DishesAvail(2) 的 分 配 
a,b,c 


TakeOrders 


a 


图 5.2 餐厅 场景 中 的 递归 式 任务 分 配 


对 于 该 修正 信念 ， 所 参与 的 智能 体 对 不 同 分 配 进行 计算 ,会 产生 相互 冲突 的 
情况 。 相 对 于 ServeGuests 的 效用 函数 ， 每 个 机 器 人 都 认为 另 一 种 分 配方 案 为 最 
佳 有 效 的 方案 。 乍 看 上 去 ， 这 似乎 是 局 部 性 原则 的 内 在 固有 问题 ， 因 为 相对 于 
域 ， 在 不 同 层次 上 规划 的 条 件 和 效用 函数 可 相互 作用 ， 即 通过 C 中 的 任意 关联 。 

这 种 效果 可 以 通过 下 列 方式 抵消 : 

全 局 分 配 一 个 全 局 分 配 算法 不 服从 局 部 性 原则 ， 因 此 即使 在 上 述 情 况 下 也 
会 产生 一 致 分 配 。 然 而 随 着 智能 体 的 个 数 、 规 划 树 的 深度 和 广度 的 不 断 增 大 ,全 
局 分 配 计算 很 快 就 不 可 行 。 男 外 如 上 所 述 ， 任 何 一 个 智能 体 都 无 法 获得 全 局 分 配 
计算 所 需 的 必要 信息 。 

转化 ”在 规划 运行 之 前 的 计算 步骤 可 通过 集成 子规 划 的 相关 信息 来 更 改 条 件 
和 效用 函数 ， 从 而 避免 上 述 情 况 。 然 而 该 过 程 取 决 于 C， 尤 其 是 列 涵 背景 知识 方 
面 的 可 判定 性 。 对 于 一 阶 逻辑 ， 这 通常 是 不 可 判定 的 。 如 果 ALICA 程序 是 由 一 
个 规划 算法 产生 的 ， 则 该 算法 需 注 意 所 产生 的 程序 应 避免 上 述 的 结构 问题 。 接 下 
来 ， 将 讨论 规范 格式 所 包含 的 内 容 。 
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DeliverOrder 


以 Serve Guests 中 最 大 
效用 函数 进行 分 配 


a,b,c 


TakeOrders 


智能 体 a 视 角 智能 体 b 视 角 


DeliverOrder 


b,c 


DeliverOrder 


ac 


ServeGuests 


| 
a | b 
智能 体 4 对 任务 DeliverOrder 分 配 智能 体 b 对 任务 DeliverOrder 分 配 
智能 体 bp 和 lc， 而 无 视 前 置 条 件 不 | 智能 体 a 和 c， 使 得 Serve Guests 
满足 | 。 的 效用 函数 最 大 
智能 体 c 视 角 


DeliverOrder 


ServeGuests 


TakeOrders 


c 


L_ 


HERRON KEK, FARE CATES 
DeliverOrder 分 配 智 能 体 a 和 4b 


图 5.3 餐厅 场景 下 不 一 致 的 任务 分 配 


通信 智能 体 还 可 通过 通信 来 实现 一 致 性 分 配 。 实 际 应 用 中 ， 通 信 过 程 占 用 
大 量 时 间 且 不 可 靠 ， 但 在 某 些 场合 或 许 是 一 个 合理 选择 。 例 如 ， 一 个 智能 体 可 通 
知 团队 成 员 其 无 法 参与 某 一 规划 ， 然 后 每 个 智能 体 将 该 信息 纳入 到 分 配 过 程 中 。 
然而 在 高 动态 领域 ， 并 不 清楚 该 信息 能 有 效 多 久 。 在 极端 情况 下 ， 这 些 信息 或 许 
在 被 所 有 智能 体 接收 之 前 已 无 效 ， 从 而 不 可 能 实现 一 致 性 分 配 。 由 于 本 书 主要 考 
虑 动态 领域 ， 因 此 应 避免 该 选项 。 

另外 ， 对 于 每 个 规划 ， 智 能 体 可 选择 其 中 一 个 作为 领导 者 来 计算 局 部 分 配 ， 
从 而 实现 分 配 一 致 性 。 例 如 ,在 STEAM” 中 就 是 采用 该 方法 。 领 导 者 的 选举 
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过 程 会 耗费 一 定时 间 ， 并 可 能 引入 其 他 问题 : ere SS TR m TE 
择 另 一 个 智能 体 作为 新 的 领导 者 ， 这 样 就 可 认为 整个 团队 通常 应 能 在 没有 一 个 明 
确 领导 者 情况 下 正常 工作 。 在 第 6 章 ， 将 讨论 在 团队 合作 中 检测 到 冲突 时 如 何 触 
发 选举 过 程 ， 以 及 所 产生 的 领导 者 如 何 负责 某 一 具体 规划 类 型 的 任务 分 配 问题 。 

AA ”通过 解 耦 分 配 问 题 可 避免 相互 作用 条 件 的 问题 ， 通 过 允许 智能 体 不 参 
与 规划 而 实际 上 闲置 来 实现 。 从 直观 上 看 ， 这 类 似 于 对 每 个 基数 为 (0，o ) 的 
规划 增加 了 一 个 任务 ， 使 得 对 于 该 任务 条 件 和 效用 函数 是 中 性 的 。 在 餐厅 示例 
中 ， 这 将 导致 对 任务 DeliverOrder 分 配 的 所 有 智能 体 最 大 化 ServeGuests 的 效用 函 
数 ， 而 多 余 的 智能 体 将 空闲 ， 在 新 菜 出 来 之 前 不 参与 规划 DeliverOrder。 

尽管 解 看 方法 使 得 对 于 全 局 问题 的 分 配 并 非 最 优 ， 但 仍 具 有 一 些 显著 性 能 。 
首先 ， 该 方法 可 保证 在 给 定 相 对 于 每 个 规划 的 条 件 和 效用 函数 智能 体 的 信念 基 均 
等 效 的 条 件 下 ， 智 能 体 对 每 个 规划 的 分 配 达 成 一 致 。 其 次 ， 该 方法 与 转化 方法 和 
通信 方法 相 兼 容 ， 即 即使 在 分 配 问题 已 解 耦 的 情况 下 ， 也 可 集成 转化 方法 或 通信 
方法 。 因 此 ， 将 讨论 规划 分 配 和 子规 划分 配 之 间 不 同 程度 的 解 耘 ， 并 在 局 部 性 原 
则 下 形成 相应 的 概念 。 

目的 是 定义 一 种 仅 限 定 于 这 些 规划 的 任务 分 配 的 递归 式 分 配 ， 使 得 所 分 配 的 
智能 体 都 依照 该 分 配 形式 。 按 照 这 种 方法 ， 可 实现 通过 层次 化 分 解 来 减少 计算 复 
杂 性 的 思想 。 对 于 包含 智能 体 分 配 树 形 结构 的 状态 ， 总 是 采用 递归 式 任务 分 配 

首先 ， 定 义 了 一 个 分 配 必须 满足 的 最 低 要 求 ， 然 后 是 使 得 规划 分 配 和 子规 划 
分 配 之 间 紧 耦合 的 严格 定义 。 

定义 5.21 (递归 式 有 效 任务 分 配 ) 设 C 为 在 假设 条 件 .二 下 智能 体 a 对 状 
态 : 的 一 个 任务 分 配 。 设 巨 为 C 中 所 涉及 的 规划 集 ， 即 巨 =1p1 ( 3a, r, z')In 
Ca’, p, r, z) eC|， 并 将 FUC 记 为 9。 则 C 为 递归 式 有 效 ， 当 且 仅 当 : 


.UGi 关上 (5.4) 
YeU9SH( AN Pre(p) A Run(p) ) (5.5) 
peP 
( YpeP)G + TeamIn(p) (5.6) 
(VpeP)pe Plans* (z) A (pe Plans(z) V ( Ap’, 7’, z') 
In(a, p’, 7’, z') eGApe Plans(z’) ) (5.7) 
(VleC)( da’, p, r)leIn(a’, p, 7, Init(p, 7)) (5.8) 
(VpeP)U(p)(G) 20 (5.9) 
(Va')( dp’, T', z')In(a', P's T', z") e CF H( ap”, 7")In(a’, p”, T", z) 
(5.10) 


Ù TAlloc* (a, z| F)(C) 表示 假设 条 件 大 下， 由 智能 体 a 对 于 状态 z 完成 
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的 C 为 一 个 递归 式 有 效 任务 分 配 。 

根据 式 (5.4)， 一 个 递归 式 有 效 任务 分 配 与 假设 和 共同 知识 相 一 致 。 因 
此 ， 根 据 定义 5.3 FS. 8, 一 个 智能 体 不 能 分 配 两 个 相互 冲突 的 任务 。 尤 其 是 ， 
已 确认 参与 规划 p 的 智能 体 不 能 在 该 规划 中 再 次 分 配 任 务 。 式 (5.5) 确保 满足 
参与 规划 的 所 有 前 置 条 件 和 运行 条 件 。 式 (5.6) 排除 了 部 分 分 配 的 规划 ， 即 确 
保 每 个 规划 都 由 适当 数量 的 智能 体 执行 。 式 (5.7) 限定 了 规划 类 型 所 对 应 规划 
的 任务 分 配 ， 该 规划 类 型 是 对 应 于 通过 采用 分 配 ， 智 能 体 所 处 的 状态 。 

根据 式 〈5.8) ， 认 为 新 分 配 任务 的 每 个 智能 体 均 处 于 相应 的 初始 状态 ， 即 
不 能 分 配 到 该 任务 的 任意 状态 。 式 (5.9) 保证 了 所 有 效用 函数 结果 均 不 小 于 0， 
由 此 认为 这 些 分 配 是 没有 危害 性 的 。 最 后 ， 根 据 式 (5. 10) ， 只 能 对 处 于 状态 z 
的 智能 体 进行 分 配 ， 认 为 这 些 分 配 已 计算 完成 。 

寻找 该 问题 最 优 解 的 任务 称 为 递归 式 任 务 分 配 问题 ， 这 将 在 后 面 详细 讨论 。 

值得 注意 的 是 ， 空 集 也 是 一 个 递归 式 有 效 任务 分 配 。 另 外 ， 一 个 递归 式 有 效 
任务 分 配 并 不 需要 保证 执行 所 有 参与 的 规划 类 型 。 这 将 允许 忽略 没有 执行 的 规 
划 ， 并 且 当 团队 中 其 余 成 员 完 成 一 个 任务 时 ， 人 允许 没有 参与 的 那些 智能 体 空 闲 。 

男 一 个 特性 ， 即 完备 性 ， 需 要 执行 更 严格 的 要 求 。 

定义 5.22 ”在 假设 条 件 上下， 智能 体 a 对 状态 = 完成 的 一 个 递归 式 任 务 分 配 
C 是 递归 完备 的 ， 当 且 仅 当 其 递归 有 效 且 

( V Pe PlanTypes(z) )( dpe P)(FUC+! TeamIn(p) ) A 
(VIn(a, p’, T, z’) €C)( V Pe PlanTypes(z’) ) (5.11) 
(( dp"eP)(FUC! TeamIn(p”) ) 

用 TAlloc: (a, zl 大 )(C) 表 示 C 为 假设 条 件 上下， 智能 体 a 对 状态 2 完成 的 一 个 
递归 完备 的 任务 分 配 。 

一 个 递归 完备 的 任务 分 配 要 求 对 于 初始 状态 z 以 及 局 部 智能 体 a 所 分 配 的 每 
个 状态 ， 团 队 需 执行 所 包含 的 每 个 规划 类 型 中 的 一 个 规划 。 换 句 话 说， 如果 在 任 
何 时 候 都 满足 该 特性 ， 则 智能 体 必 须 保 证 对 于 所 处 的 每 个 状态 z, LA P e Plan- 
Types(z) 的 所 有 规划 类 型 ， 都 要 执行 一 个 peP 的 规划 。 注 意 ， 智 能 体 a 并 不 需 
要 必须 参与 所 有 规划 的 执行 ， 只 需 确保 整个 团队 要 执行 所 有 规划 。 这 类 似 于 联合 
意图 ” ， 即 所 有 参与 智能 体 都 要 执行 规划 ， 即 使 某 些 智能 体 并 没有 真正 参与 执 
行 。 当 参与 智能 体 损 坏 以 及 规划 执行 存在 风险 时 ， 为 完成 规划 执行 ， 没 有 参与 的 
智能 体 必 须要 积极 参与 。 

强制 实施 完备 性 特性 并 不 会 对 上 述 场景 产生 任何 问题 ， 但 当 一 个 智能 体 或 一 
组 智能 体 不 能 执行 子规 划 ， 而 这 又 是 更 高 层 所 需 的 分 配 时 ， 会 导致 团队 状态 产生 
冲突 。 

完美 分 配 概念 反映 了 单个 分 配 问题 的 更 加 紧密 的 耦合 : 
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定义 5.23 在 假设 条 件 大 下 ， 智 能 体 a 对 状态 z 完成 的 一 个 递归 式 任务 分 
Bic C 是 递归 完美 的 ， 当 且 仅 当 其 递归 有 效 且 
(VPePlanTypes(z) )In(a@’,p’,7,z) e F UC— 
(az p'r Jp reP Aika ,pr a l eF UC (5.12) 
In(a,p,t,z') eC—(( Va')In(a',p,r,z’) EC 一 
( VP e PlanTypes(z’) )( dp’,r’,z")p'’ePAIn(a’,p',r',2z")) (5.13) 
类 似 于 之 前 定义 , 设 TAlloc, (a, z| F)(C) 表示 C 为 在 假设 条 件 斑 下 ， 智 能 体 
a 对 状态 z 完成 的 一 个 递归 完美 的 任务 分 配 。 
式 (5.12) 和 式 (5.13) 要 求 对 所 有 智能 体 进 行 任务 分 配 。 即 每 个 处 于 初 
始 状态 z 的 智能 体 均 部 分 执行 z 中 每 个 规划 类 型 [ 见 式 〈5. 12) ] 。 另 外 ， 根 据 式 
(5. 13)， 对 于 递归 式 任务 分 配 ， 也 同样 如 此 。 如 果 分 配 智 能 体 a， 使 其 处 于 某 一 
特定 状态 ， 则 在 该 状态 下 的 所 有 智能 体 都 必须 参与 执行 该 状态 所 包含 的 所 有 规划 
类 型 。 
显而易见 ， 根 据 定义 5.21 中 的 式 (5.6), 一 个 递归 式 完 美 分 配 也 是 递归 式 
完备 分 配 。 完 备 分 配 和 完美 分 配 都 会 存在 耦合 问题 ， 即 在 不 同 层 次 上 以 该 方式 相 
互 作用 的 规划 效用 函数 和 条 件 ， 使 得 智能 体 不 能 单独 计算 各 自分 配 。 
在 某 种 程度 上 ， 规 划 应 具有 一 定 的 兼容 性 以 避免 这 种 相互 作用 。 这 种 兼容 概 
念 取决 于 域 公理 ， 了 wm。 
定义 5.24 ”规划 类 型 P 与 规划 p 中 的 任务 7 分 层 兼容 ， 当 且 仅 当 对 于 所 有 
的 信念 基 大 ， 如 果 在 假设 条 件 大 下 存在 对 于 规划 p 的 一 个 有 效 分 配 C， 同 样 在 假 
设 条 件 FUC 下 也 存在 一 个 对 于 规划 p'eP 的 一 个 有 效 任务 分 配 C'， 使 得 lalIn 
(a,p,r,Init(p,r)) eFUCI D{alIn(a,p',r’,z’) eFUC'}, 
定义 5.25 HFE Mp tH, SAMS: 
@ 对 于 所 有 任务 reTasks(p) PlanTypes(Init(p, 7)) 中 的 所 有 规划 类 型 都 
与 p 中 的 r 分 层 兼 容 。 
@ 对 于 所 有 状态 zs States(p), UPlanTypes(z) 中 的 所 有 规划 都 合理 。 
因此 ， 在 递归 式 任务 分 配 过 程 中 ， 对 于 一 个 兼容 规划 ， 利 用 最 多 可 用 的 智能 
体 可 推导 出 一 个 有 效 分 配 。 该 稳健 性 可 保证 在 给 定 所 参与 智能 体 的 信念 基 不 发 生 
冲突 条 件 下 ， 团 队 成 员 可 就 递归 式 任务 分 配 的 计算 达成 一 致 。 
合理 规划 的 概念 并 不 能 保证 一 定 会 得 到 完美 分 配 ， 这 需要 利用 以 下 两 个 定义 
所 反映 的 更 加 充分 的 概念 。 
定义 5.26 ”规划 类 型 P 与 规划 p 中 任务 7 是 完全 分 层 兼 容 的 ， 当 且 仅 当 对 
于 所 有 信念 基 矿 ， 如 果 在 假设 条 件 玉 下， 对 于 规划 p 存在 一 个 有 效 分 配 C， 且 在 
假设 条 件 UC 下 ， 对 于 规划 p'e P 也 存在 一 个 有 效 任务 分 配 C'， 使 得 1alIn(a， 
p,t,Init(p,rt)) eF UC} = jalln(a,p',T', z’) e FUC} a 
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定义 5.27 MFlan, Mp 完全 合理 ， 当 且 仅 当 : 

@ 对 于 所 有 任务 reTasks(p) PlanTypes(Init(p, 7)) 中 的 所 有 规划 类 型 都 
Ej p PHI 7 完全 分 层 兼 容 。 

@ 对 于 所 有 状态 ze States(P) ，UPlanTypes(z) 中 的 所 有 规划 都 完全 合理 。 

这 样 ， 在 一 个 完全 兼容 的 规划 中 ， 所 有 可 用 智能 体 都 将 被 分 配 ， 从 而 产生 一 
个 完美 分 配 。 

上 述 定 义 允 许 执行 递归 式 任 务 分 配 的 各 种 不 同 操作 ， 从 仅 需 要 结果 有 效 的 基 
本 情况 ， 到 完美 分 配 的 更 高 要 求 。 给 定 所 执行 的 规划 合理 或 甚至 完全 合理 ， 则 可 
确保 获得 相应 的 结果 ， 这 将 在 5. 12 节 讨 论 。 

不 论 是 合理 还 是 完全 合理 ， 都 可 根据 域 和 产生 过 程 来 创建 。ALICA 程序 的 
开发 过 程 包括 一 个 验证 步 又， 用 于 检查 所 建 模 规划 的 各 自 特 性 ， 而 一 个 规划 算法 
或 学 习 算 法 限制 只 能 产生 一 个 合理 规划 或 完全 合理 规划 。 通 常 ， 一 个 不 合理 的 规 
划 可 通过 其 具体 条 件 使 之 满足 子规 划 条 件 而 转化 为 一 个 合理 规划 。 当 然 ， 这 要 求 
在 父 层 次 上 所 有 参与 的 智能 体 都 应 具有 相应 的 必要 信息 。 

接 下 来 ， 将 讨论 一 种 最 优 分 配 概念 ， 使 得 所 涉及 的 效用 函数 最 大 。 在 5. 12 
节 ， 将 推导 一 个 相应 的 任务 分 配 算法 。 


5.10 最 优 式 任务 分 配 


在 前 面 章 节 中 ， 正 式 定义 了 任务 分 配 问 题 及 其 有 效 解 。 在 此 ， 将 重点 考虑 何 
为 一 个 最 优 解 以 及 该 如 何 计算 。 

Nair EA VO 对 该 问题 进行 了 详细 讨论 ， 尽 管 将 其 看 作 和 角色 分 配 ， 而 并 没 
有 像 本 书 一 样 将 角色 和 任务 区 分 开 来 。 在 其 观点 中 ， 一 个 任务 分 配 应 考虑 由 事 
件 或 动作 产生 的 潜在 回报 。 一 个 全 局 最 优 任务 分 配 还 应 考虑 由 于 智能 体 损坏 或 
情况 发 生变 化 而 导致 的 进一步 重 分 配 。Nair 表明 该 问题 是 一 个 NEXP 时 间 完 备 
问题 ， 因 此 难以 处 理 。 而 一 个 局 部 最 优 任务 分 配 仅 考虑 当前 情况 ， 仍 是 一 个 
NP 难题 。Nair 同时 还 表明 如 何 通过 一 个 考虑 潜在 触发 重 分 配 的 预 运行 计算 来 
提高 局 部 任务 规划 算法 。 然 而 在 复杂 领域 中 ， 由 于 规模 随 触发 器 个 数 和 策略 个 
数 之 积 指数 增长 ， 导 致 该 处 理 过 程 很 快 就 不 可 行 。 男 外 ，Nair 等 人 仅 考虑 独立 
回报 ， 如 假设 将 回报 与 执行 某 一 特定 任务 的 一 个 智能 体 相关 联 。 而 本 书 允 许 采 
用 相互 关联 的 效用 函数 ， 这 依赖 于 相应 规划 的 全 分 配 。 而 且 ， 在 高 动态 领域 ， 
难以 或 甚至 无 法 获得 未 来 回报 的 必要 的 概率 估计 。 最 后 为 简化 问题 ， 本 书 仅 考 
虑 分 层 结构 ， 其 中 每 一 层 上 不 同 的 效用 函数 负责 分 配 过 程 。 这 些 效用 函数 不 一 
定 相关 ， 但 可 相互 推导 。 

为 设计 一 个 合适 的 通用 且 有 效 的 分 配 算法 ， 以 下 前 提 条 件 需 成 立 : 
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o 回报 问题 留 作 以 后 解决 。 效 用 函数 可 考虑 回报 ， 但 是 针对 特定 域 的 。 

o 可 非常 频繁 进行 分 配 ， 因 此 要 求 分 配 必须 高 效 。 

o 在 运行 期 间 ， 给 定 任务 分 配 和 相应 情况 的 条 件 下 ， 规 划 的 效用 函数 必须 
完全 可 计算 。 这 不 依赖 于 子规 划 的 分 配 。 这 种 依赖 关系 可 在 预 运行 计算 步骤 中 
去 除 。 

为 此 ， 本 书 将 分 层 最 优 作为 递归 式 任务 分 配 问 题解 的 衡量 标准 。 

定义 5.28 在 假设 条 件 上下， 智能 体 a 对 状态 z 的 一 个 递归 式 任务 分 配 C 
是 分 层 最 优 的 ， 当 且 仅 当 C 为 最 小 集 ， 使 得 对 于 C 中 所 有 规划 类 型 P， 即 ( Aa’, 
p.t,z')pePAIn(a',p,t,z') eC: 

{In(a’,p’,7,z’) lIn(a’,p',7,z') eC Ap' EP} = argmaxmaxU ( p) (FUD) 
满足 TAlloc * (a, zl F)(C) ak TAlloc” (a, zl F)CG), 

这 样 ， 一 个 分 层 最 优 任务 分 配 将 在 保持 完备 性 或 完全 完备 性 下 (根据 需要 
哪 种 特性 ) ， 使 得 每 个 参与 规划 类 型 的 效用 函数 最 大 。 值 得 注意 的 是 ， 如 果 只 需 
有 效 性 ， 即 只 要 求 TAlloe (a, zl 大 )(C) ， 则 由 于 对 智能 体 执行 任何 规划 都 没 
有 激励 ， 空 分 配 为 最 优 。 这 种 激励 可 在 没有 完备 性 要 求 下 选择 规划 来 执行 ， 然 而 
选择 何 种 规划 执行 应 由 规划 自身 结构 〈 由 规划 算法 提供 ) 以 及 团队 状态 来 确定 。 
因此 认为 这 样 一 种 附加 的 选择 机 制 是 多 余 的 ， 从 而 将 完备 性 作为 递归 式 任务 分 配 
所 需 的 至 少 必 要 特性 。 


5.11 3M Pa Be 


除了 前 置 条 件 和 运行 条 件 ， 效 用 函数 反映 了 在 某 一 特定 情况 下 一 个 规划 的 适 
用 性 ， 并 决定 了 任务 分 配 。 因 此 ， 其 在 ALICA 中 具有 重要 作用 。 如 上 节 所 述 ， 
一 个 任务 分 配 的 计算 需要 一 个 高 效 的 搜索 。 在 此 对 效用 函数 施加 一 种 结构 ， 以 允 
许 启发 式 估 计 。 

首先 ， 效 用 函数 取决 于 特定 域 反映 的 当前 情况 和 域 独立 函数 反映 的 当前 角色 
分 配 。 

定义 5.29 函数 pri(p) 对 规划 p 执行 中 所 有 智能 体 对 各 自 当前 任务 的 优先 
级 进行 评估 : 

-1 FH da,r,r) bla,p,r,t| A Pref(r,r) <0 
a FL ol a.p.7.r] Pref(r,7) 其 他 


式 中 中 [Lac,p,r, =HasRole(a,r) A ( dz) In(a,p,7,z) « 
也 就 是 说 ，pri(p) 将 智能 体 对 其 相应 任务 的 所 有 优先 级 相 加 ， 然 后 利用 因 


pri(p)(F) = | 
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子 T 和 | 对 结果 归 一 化 。 若 单个 优先 级 小 于 零 ， 则 pri(p) 定义 为 -1， 认 为 优先 
级 为 负 表示 无 能 力 完成 任务 。 

定义 5.30 (效用 函数 ) 相对 于 信念 基 大 ， 一 个 规划 六 的 效用 函数 X(p) (F) 
的 形式 为 


=f pri( F) <0 
U(p)(F) = dwopri(F) + D aes fil F) F | = TeamIn(p) 
0 其 他 


效用 函数 是 函数 pri, fi, oo, /在 信念 集 上 的 加 权 和 。 权 重 wi 为 常数 ， 使 得 
,ow =1 且 (Vi) 0<w<1。 MBS: 2°-> [0…1] 反映 了 特定 域 信息 。 
根据 5. 1 节 中 介绍 的 局 部 性 原则 ， 每 个 /中 的 谓词 In(a, p, r, z) 均 发 生 时 ， 
p 可 能 仅 表示 Po 

根据 该 定义 ， 效 用 函数 仅 限于 加 权 和 。 然 而 由 于 w; 可 设 为 0 且 每 个 加 项 都 
可 任意 复杂 ， 因 此 该 结构 并 没有 局 限 性 。 下 节 将 表明 阐述 该 结构 并 保持 每 个 加 项 
尽 可 能 简单 在 实际 中 非常 有 用 。 


5.12 任务 分 配 算法 


一 个 任务 分 配 算 法 计算 了 智能 体 的 任务 分 配 ， 表 示 为 一 个 信念 集 。 计 算 结 果 
应 满足 定义 5. 20 或 定义 5. 28 中 分 层 分 配 的 情况 。 

本 书 提出 了 一 种 基于 由 Hart 等 人 '"” 提 出 的 A "搜索 算法 。 与 传统 定义 不 同 ， 
在 此 采用 最 大 效用 号 数 而 不 是 最 小 目标 函数 。 为 此 ， 推 导出 效用 函数 的 启发 式 
估计 Xt。 在 每 次 迭代 中 ， 搜 索 过 程 通过 将 一 个 智能 体 分 配给 所 有 可 能 任务 来 扩展 
搜索 节点 。 一 旦 所 有 智能 体 被 分 配 并 且 根 据 所 计算 的 分 配 满足 规划 条 件 ， 则 完成 
一 次 分 配 。 由 于 效用 函数 将 智能 体 的 信念 状态 映射 到 实数 ， 因 此 启发 式 函数 会 将 
信念 状态 以 及 未 分 配 的 智能 体 都 映射 到 实数 : H(p): 2° x2" >R, A* 算法 的 
计算 效率 取决 于 启发 式 搜 索 的 准确 率 和 计算 时 间 。 

根据 定义 5.30， 给 定 一 个 效用 函数 ， 可 用 如 下 方式 来 推导 启发 式 估计 : 在 
实现 目标 分 配 6 的 路 径 上 ， 给 定 一 个 假设 条 件 坟 下 的 搜索 节点 ， 以 及 部 分 分 配 克 
和 可 用 智能 体 4， 应 满足 : 

U(p)( FUG) <maxl(p) (FUHUH’) 

其 中 ，H' 完 全 分 配 4 中 所 有 智能 体 。 男 外 ， 由 于 w,S0, W 

maxU(p) (FUHUH') <wmaxpri( FUHUH') + > wmaxfi( TF UHUH") 


}<isn 


也 就 是 说 ， 通 过 逐个 最 大 化 每 个 加 项 ， 可 构建 一 个 启发 式 估 计 方 法 。 再 次 提 
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醒 与 传统 定义 不 同 ， 该 启发 式 方法 包括 效用 函数 ， 因 此 可 估计 一 个 局 部 节点 的 完 
全 效用 而 不 是 潜在 增益 。 这 只 是 简化 如 下 定义 的 一 种 技术 手段 。 
在 仅 需 要 完全 分 配 的 情况 下 ，maxpri( 下 UHUH') 可 由 下 式 进一步 估计 : 


- dlp, F,A] 
1 
hy (p) (FA) = | Al ( > Fhaola p ECT) 4. 
py aea aXrylap,r,r] Pref( r,T) ) 其 他 


式 中 Ølp,F,A] =F +( Ja eA,r) HasRole(a,r) A( 4z,7)In(a,p,r,z) A 
Pref(r,7) <0; 


中 [a,p,T,r] a ee | A ( 4z)In(a,p,7,z); 


wLa,p,t,r] St a Ar eTasks(p) A (n,m) =€,(p,t,7) Am 
<lla'lIn(a’',p,7,z) eF}|。 
BEREH, hlp) (F, A) 总 结 归纳 了 每 个 未 分 配 智能 体 对 Tasks(p) 中 任 
一 任务 的 最 大 优先 级 。 
如 果 要 求 分 配 结果 应 为 完全 完备 的 ， 则 可 采用 更 为 严格 的 启发 式 方法 ， 即 


Dlp,F,A] oe +( 4Ja,r) HasRole(a,r) A( 4z,7)In(a,p,7,z) A Pref(r,r) < 
OV(da eA) „ma ,Pref(r,7) <0 
以 使 启发 式 方法 可 反映 未 分 配 智 能 体 必须 分 配给 其 角色 具有 正 优先 级 的 任务 。 
通常 : 
maxpri( FUHUH') Shr (p) (F,A) 
HF h,.(p)(F, A) 忽视 规划 条 件 ， 因 此 可 能 会 对 可 能 值 估计 过 高 。 值 得 注意 
的 是 ， 用 于 完全 分 配 问题 的 启发 式 方法 也 适用 于 完美 完全 分 配 问题 ， 反 之 则 不 行 。 
特定 域 函 数 : 2% 一 RR 由 相应 的 启发 式 函数 hh: 2“ x2%>R 进 行 估计 。 由 
于 函数 可 任意 选择 ， 因 此 难以 对 相应 的 启发 式 函数 给 出 一 个 明确 定义 。 
假设 7 为 中 的 任务 集 ， 则 ;可 定义 为 
hi(p)(F,A) = max fi(p) (TUQ) 
AP 中 0,4, 丰 ,p] =O {| In(a,p,r,Init(p,7r)) lace AAtreT,} A 
(In(a,p,7,z) eQAIn(a,p,r',z') eQ>7 =7' 
Az=z')A(VreT,)( dn,m) 
E,(p,t,7) =(n,m) Aljal( dz)In(a,p,7,z) eQUF! lsm, 
理想 情况 下 ， 每 个 函数 /都 取决 于 尽 可 能 少 的 任务 ， 从 而 可 采用 简单 有 效 的 
启发 式 方法 。 尽 管 以 上 述 方式 构建 的 启发 式 方法 能 被 接受 ， 但 大 多 数 情 况 下 ， 一 
种 利用 自身 结构 所 构建 的 启发 式 方法 的 执行 性 能 明显 更 好 
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现在 ， 考 虑 下 列 示例 : 
示例 5.2 示例 5.1 中 厨师 采用 的 表达 式 : 


f( ServeCuests) (F) = |} a|In( a Servetuents DeliverOnder.2) eF} | 


可 自然 地 扩展 为 启发 式 形式 : 

ht Sevveuedia) LFA) = | “lina SenveCuests, Deliverinler.2) eFVacA} | 
由 此 可 产生 一 个 比 上 述 定义 更 加 有 效 的 启发 式 结构 。 

在 机 器 人 足球 领域 ， 一 种 常用 方法 是 让 最 接近 球 的 机 器 人 执行 进攻 任务 ， 这 
可 用 函数 表示 为 


_ Dist(a, ball) 


fp) (F) 二 maxDist 
式 中 ”Dist 一 一 两 个 物体 之 间 的 欧 几 里 得 距离 ; 
maxDist 一 一 可 能 的 最 大 距离 ， 如 足球 场地 的 对 角 线 。 


启发 式 估计 可 通过 对 函数 /进行 简单 扩展 来 定义 : 
wip) ( Fä) = en I p r 
式 中 ola,p,F,A] =In(a,p,Attack,z) e F V (E,(p, Attack,F) = (n,m) A 
m< | {a'|In(a", Attack ,p,z) eF}|NAaeA), 
在 需要 传 球 的 另 一 种 情况 下 ， 传 球 机 器 人 和 接 球 机 器 人 之 间 的 距离 非常 关 
HE, BUERE XIRKA 


> _ (7m —Dist(a,b) \’ 
fp) (F) tae E ee EA 1 ( maxDist ) 
其 中 ， 设 定理 想 的 传 球 距 离 为 7m。 
相应 的 启发 式 函数 会 稍微 复杂 : 
- : _ (Tm —Dist(a,b)y° 
Fp) (7 ,4) = eS sea ( max Dist 


HH: ola,p,F,A| =In(a,p,Passing,z) e F V (E,(p, Passing, F) =(n,m) A 
m<|ja’|In(a’,Passing,p,z) eF} | \aeA; 

wl a,b,p,F,A] =In(a,p,Receiver,z) e F V (é,(p, Receiver, ) = (n,m) 

Am<|ja'|In(a’',Receiver,p,z) eF} | Abe AAb#a), 

上 述 示例 表明 尽管 在 某 些 情况 下 自动 构建 上 述 启 发 式 函 数 可 产生 不 错 的 结 

果 ， 但 在 其 他 情况 下 ， 也 可 容易 地 手动 构建 一 种 更 加 有 效 的 启发 式 函 数 。 尤 其 是 

当 每 个 加 项 中 所 涉及 的 任务 个 数 较 多 时 ， 高 效 的 启发 式 函 数 非常 关键 。 在 此 并 不 

深入 讨论 启发 式 函 数 的 自动 构建 ， 感 兴趣 的 读者 可 参见 参考 文献 [120, 123], 
在 给 定 所 有 单个 启发 式 估计 的 条 件 下 ， 可 构造 完备 启发 式 函 数 : 
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=1 hi(F,A) <0 
H(p) (F,A) = yh FA) + 之 sets (F,A) ol p,F,A] 
0 其 他 
RP olp,F,A]=Al> > max(0,n — | la’|In(a’,p,7,z) eF ||) A 


nt e Tasks(p) A, (Tr, p, F) =(n,m) 


|A|< 5 m- | {a’|In(a’,p,7,z) EF } |. 


n:7 e Tasks(p) Né,(7,p,F ) =(n,m) 
AR Te OUD RARUA ACK PRB, AE M— PSE F A 算法 的 搜索 算法 。 一 个 规 
划 类 型 的 任务 分 配 算 法 见 表 5.2。 假 设 对 智能 体 、 任 务 和 规划 进行 总 排序 ( 需 保 
证 给 定 同样 的 信念 状态 ) ， 不 同 的 智能 体 可 计算 同一 分 配 ， 即 使 不 同 分 配 的 效用 
函数 相同 。 
该 算法 包括 两 个 主要 困 数 : InitTaskAlloc 和 NextAlloc, InitTaskAlloc 利用 相 
应 规划 类 型 中 每 个 规划 的 一 个 节点 来 初始 化 搜索 顺序 。 每 个 节点 包括 一 个 局 部 分 
配 和 一 个 未 分 配 智能 体 的 有 序列 表 。 将 尚未 在 一 个 规划 中 分 配 的 智能 体 增 加 到 每 
个 节点 的 自由 智能 体 列表 中 。 
根据 启发 式 方法 ，NextAlloc 对 最 优 节点 不 断 和 迭代 扩展 ， 直 到 找到 一 
足 AllocGoal 的 分 配 ， 或 者 直到 节点 序列 为 空 ， 此 时 认为 分 配 失败 。 随 后 调 
用 NextAlloc 函数 ， 以 效用 降序 返回 假设 条 件 .二 下 对 规划 类 型 的 所 有 有 效 任务 
分 配 。 
表 5.3 中 的 Expand 函数 反映 了 搜索 节点 之 间 的 继承 关系 ， 并 产生 该 搜索 节 
点 的 子 节点 集 。 取 决 于 整个 问题 是 否 可 以 找到 一 个 完美 完全 分 配 ， 该 函数 可 使 得 
所 有 智能 体 均 参与 任务 分 配 ， 或 允许 忽略 智能 体 。 
值得 注意 的 是 ， 同 一 规划 类 型 中 不 同 规划 的 分 配 是 直接 竞争 的 关系 ， 即 使 效 
用 函数 可 能 不 同 。 因 此 ， 从 规划 类 型 中 如 何 选择 一 个 规划 的 问题 也 是 任务 分 配 问 
题 的 一 部 分 ， 这 需要 规划 的 效用 函数 具有 可 比 性 。 对 效用 函数 施加 的 结构 和 将 有 
效 分 配对 应 于 [0，1] ， 有 助 于 设计 具有 可 比 性 的 效用 函数 。 
表 5.2 一 个 规划 类 型 的 任务 分 配 算法 
InitTaskAlloc(P.F,Agents) { 
Queue_P := empty Queue: 
foreach(Plan p in P) { 
new Node n; 


n.Plan := p; 
foreach(Agenta in Agents) { 


if(F contains In(a,p,t,z) for some t.z) { 


Remove a from Agents: 
} 
} 
Add n to Queue_P: 
} 
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foreach (Node n in Queue_P) { 
n.AgentsAvail := Agents; 
n.Alloc := 0; 
n. Heuristic := H(n.Plan)(F, n.AgentsAvail ); 


} 


Sort Queue_P by heuristic ; 


} 


NextAlloc(P,F) { 
while(Queue_P is not empty) { 
n := RemoveFirst(Queue_P); 
if (AlloeGoal(n,P,F)) return n.Alloc; 
Add Expand(n) to Queue_P; 
Sort Queue_P by heuristic ; 
} 
return FAILURE; 
} 


AllocGoal(node,P,F) { 
if (node.AgentsAvail not empty or node. Heuristic < 0) return false; 
foreach(Task t in node.Plan) { 
(MminsMmax) := 6 (node.Plan,t.F); 
n ;= I{a | In(a,node.Plan,t,z) € node.Alloc U F}; 
if (n <Mmin Vn > max) return false; 
} 
if (F U node.Alloc + Pre(node.Plan) A Run(node.Plan)) return true; 
else return false ; 


} 


表 5.3 任务 分 配 的 节点 扩展 函数 


Expand(node,F) { 
if (node.AgentsAvail is empty) return 0; 
a := RemoveFirst(node.AgentsAvail ); 
nodes := 0; 
foreach(Task t in node.Plan) { 
n := copy of node; 
Add In(a,node.Plan, t ,Init(node.Plan,t)) to n.Alloc; 
(aminyamax) := 6(node.Plan,t,F): 
n := |l{a | In(a,node.Plan,t,z) in n.Alloc U F}; 
if (n < nmax An+|n.AgentsAvail| > nmin) { 
n. Heuristic := H(n.Plan)(F U n.Alloc.n.AgentsAvail ): 
Add n to nodes; 
} 


(perfectly complete allocation not required) { 
n := copy of node; 
n. Heuristic := H(n.Plan)(F U n.Alloc,n.AgentsAvail ); 
Add n to nodes; 


return nodes; 


} 
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命题 1 ”如 果 对 规划 p 任务 分 配 算法 返回 一 个 分 配 结果 ， 则 该 任务 分 配 有 效 。 

证 明 : 该 证 明 非 常 简单 。 首 先 ， 如 果 返 回 一 个 分 配 结果 ， 则 必然 满足 Alloc- 
Goal 所 定义 的 条 件 。 因 此 其 效用 值 大 于 0， 从 而 由 于 满足 基数 ， 也 必然 满足 规划 
P 的 TeamIn(p)。 另 外 ， 还 满足 规划 p 的 前 置 条 件 和 运行 条 件 。 由 于 对 于 某 一 智 
能 体 a 和 Tasks (p) 中 的 某 一 任务 r+， 返回 的 分 配 结果 中 所 包含 的 信念 只 有 
In(a, p, 7, Init(p, 7) ) 形 式 ， 并 且 只 能 对 假设 条 件 大 下 未 分 配 的 智能 体 进 行 分 
配 ， 因 此 分 配 结果 也 与 上 和 卫 * 相 一 致 。 

命题 2 ”如 果 在 假设 条 件 大 下 ， 利 用 智能 体 4 对 规划 类 型 P 存在 一 个 有 效 任 
务 分 配 ， 则 分 配 结果 必然 会 由 NextAlloc(P, F) 返回 。 

证 明 : 反 证 法 ， 假设 没有 返回 一 个 有 效 任务 分 配 C。C 将 智能 体 4 分 配 到 一 
个 规划 pe P， 这 样 C 既 没 有 扩展 也 不 满足 AllocGoal 中 的 条 件 。 根 据 InitTaskAl- 
loc 的 定义 ,创建 一 个 规划 p 的 初始 节点 ， 如 果 基 数 允 许 ， 随 后 的 Expand 函数 将 
所 有 可 用 智能 体 分 配给 中 的 任务 ， 由 于 智能 体 集 和 任务 集 均 有 限 ， 因 此 最 终 必 
须 扩 展 C， 并 且 所 有 有 效 任务 分 配 均 满 足 基数 。 

由 于 C 有 效 ， 其 效用 值 及 其 启发 式 估 计 都 不 小 于 0。 另 外 还 满足 p 中 所 有 任 
务 基 数 ， 以 及 假设 条 件 王 和 p 的 前 置 条 件 与 运行 条 件 。 因 此 ， 也 必然 会 满足 
AllocGoal 中 的 所 有 条 件 。 

注意 到 定义 5. 19 和 表 5. 2 均 是 指 通过 上 来 证 明 前 置 条 件 和 运行 条 件 的 一 个 
智能 体 的 能 力 。 一 个 不 完备 的 证 明 算 法 可 能 导致 本 应 有 效 的 分 配 无 效 。 然 而 在 实 
际 中 ， 这 些 条 件 通常 非常 简单 ， 可 由 对 应 布尔 值 的 几 个 必要 函数 表示 。 

给 定 一 个 任务 分 配 算法 ， 递 归 式 扩展 非常 简单 。 表 5. 4 给 出 了 递归 式 任务 分 
配 算法 。RecTaskAlloc 函数 在 给 定 状 态 z 下 将 智能 体 分 配给 所 有 规划 类 型 。 如 果 
采用 该 分 配 结果 ， 应 在 分 配 智能 体 所 处 状态 下 递归 调用 其 本 身 。 

表 5.4 递归 式 任务 分 配 算法 


Let a be the calculating agent 
RecTaskAlloc(z.F) { 
A:= {x | In(x,p.t.z) EF}: 
Q:= 0: 
foreach(PlanTypes P € PlanTypes(z)) { 
InitTaskAlloc(P,F,A); 
do { 
G := NextAlloc(P.F): 
if (G = FAILURE) return FAILURE: 
zn := state of a in P according to G; 
if(zn exists ) H := ReeTaskAlloe(zn,FUG); 
else H:= 0; 
} while(H = FAILURE): 
Q := QUGUH; 
} 


return Q: 


| 
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命题 3 ”在 假设 条 件 二 下 ， 智 能 体 a 在 状态 z 利用 RecTaskAlloc 函数 进行 的 
任务 分 配 是 递归 有 效 的 。 

证 明 : 设 C 为 递归 式 分 配 结果 。 由 于 根据 命题 1， 通过 调用 NextAlloc 函数 
可 将 C 构建 为 任务 分 配 联合 ， 因 此 满足 规划 a 的 所 有 前 置 条 件 和 运行 条 件 ， 从 
而 也 满足 定义 5. 21 中 的 式 (5.5) 。 根 据 命 题 1, 式 (5.6) 和 式 (5.9) 也 同样 
满足 。 

由 于 RecTaskAlloc 利用 智能 体 a 所 分 配给 自身 的 状态 zn 递归 简化 规划 结构 ， 
因此 条 件 5.7 满足 。 另 外 又 由 于 Expand 仅 分 配 到 初始 状态 ， 所 以 式 (5.8) 也 满 
足 。 由 于 只 对 处 于 原始 状态 z 的 智能 体 进行 分 配 ,， 式 (5.10) 也 满足 。 

最 后 ， 在 同一 规划 类 型 中 ， 智 能 体 不 能 被 分 配 两 次 ，InitTaskAlloc 会 排除 所 
有 已 具有 相应 规划 类 型 的 智能 体 ， 并 且 对 于 某 些 智能 体 a、 规 划 p、 任 务 + 和 初 
始 状态 z, C 中 仅 包含 形式 In(a, p，+，z) 的 字面 意义 ， 因 此 满足 式 (5.4). 

命题 4 在 假设 条 件 上 下 ， 智 能 体 a 在 状态 z 利用 RecTaskAlloc 进行 的 任务 
分 配 是 递归 完备 的 。 

证 明 : i C 为 递归 式 分 配 结果 。 根 据 命题 3，C 为 递归 有 效 。 由 于 C 是 由 
NextAlloc 产生 的 有 效 分 配 的 联合 ， 并 且 RecTaskAlloc 返回 一 个 分 配 ， 当 且 仅 当 智 
能 体 a 分 配给 所 有 状态 ， 由 于 智能 体 a 分 配给 每 个 规划 中 至 多 一 个 状态 ， 因 此 C 
和 大 可 保证 对 每 个 规划 类 型 智能 体 a 在 每 个 状态 下 的 分 配 都 是 一 个 有 效 分 配 。 
这 满足 定义 5. 22 中 的 式 (5.11). 

命题 5 ”在 假设 条 件 上 下 ， 智 能 体 a 在 状态 z 利用 RecTaskAlloc 进行 的 任务 
分 配 是 递归 完全 完备 的 。 

证 明 : i C 为 递归 式 分 配 结果 。 首 先 ，5C 为 递归 完备 的 。 由 于 如 果 需 要 的 
if, Expand 随后 会 对 任务 分 配 所 有 智能 体 ， 并 且 ALLocGoal 要 求 未 分 配 智能 体 
的 集合 为 空 ， 因 此 任务 分 配 问题 的 所 有 解 可 由 InitTaskAlloc(P, F, A) 初始 化 ， 
将 4 中 所 有 智能 体 分 配 到 P 中 的 一 个 规划 。 由 于 4 中 只 包含 位 于 父 状态 的 智能 
体 ， 因 此 式 (5.12) 和 式 (5.13) 满足 。 

命题 6 ”如 果 存 在 一 个 递归 完全 完备 的 任务 分 配 ， 则 如 果 需 要 的 话 ，Rec- 
TaskAlloc 会 返回 该 任务 分 配 。 

证 明 : 根据 式 (5.12) 和 式 (5. 13 ) ， 一 个 递归 完全 完备 的 任务 分 配 必须 将 
智能 体 分 配给 所 有 涉及 规划 类 型 中 的 规划 。 由 于 RecTaskAlloc 在 每 个 规划 类 型 
(根据 命题 2) 的 所 有 有 效 任务 分 配 中 不 断 和 迭代， 直到 解决 相应 的 递归 问题 ， 并 
且 所 有 条 件 和 效用 函数 都 是 局 部 规划 ， 因 此 该 命题 成 立 。 

命题 7 ”如 果 存 在 一 个 递归 完备 的 任务 分 配 ， 则 如 果 需 要 的 话 ，RecTaskAl- 
loc 会 返回 该 任务 分 配 。 

证 明 : 类 似 于 命题 6 的 证 明 ， 不 同 的 是 每 一 个 单个 分 配 步 又 。 根 据 Expand, 
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NextAlloc 对 所 有 可 能 的 分 配 进行 完全 迭代 以 确定 智能 体 。 如 果 这 些 智能 体 中 有 
一 个 满足 AllocGoal， 则 最 终 返 回 该 分 配 。 

由 此 ， 列 表 5.4 中 的 算法 会 求 得 递归 式 任务 分 配 问 题 的 一 个 合理 且 完 备 的 
解 。 然 而 对 于 示例 5.1 中 的 餐厅 场景 ， 仍 不 能 保证 所 有 参与 智能 体 达 成 一 致 。 问 
题 在 于 只 满足 DeliverOrder 的 规划 类 型 在 ServeGuests 规划 中 与 DeliverOrder 任务 
并 不 完全 兼容 ， 从 而 ServeGuests 规划 不 完全 合理 。 但 是 ， 规 划 类 型 兼容 ， 因 此 
ServeGuests 规划 又 是 合理 的 。 因 此 ， 在 给 定 相 同 信念 基 的 条 件 下 ， 智 能 体 a、。 
All 可 对 一 个 完备 分 配 达成 一 致 ， 但 并 不 是 一 个 完全 完备 的 分 配 。 

定义 5.31 ”如果 UC 与 之 * 一 致 ， 则 分 配 集 C 也 一 致 。 

如 果 Uilm(a,p,r,z) |In(a,p,7,z) es 有 BApsPi 与 Zs 一 致 ， 则 具有 信念 基 
BANS REAR 4 对 规划 类 型 P 的 所 有 分 配 均 达成 一 致 。 

引 理 1 如 果 在 相同 假设 条 件 玉 下， 所 有 智能 体 a e 4 对 规划 类 型 P 单独 计 
算 一 个 分 配 ， 则 可 得 到 相同 的 分 配 结果 。 

证 明 : 根据 每 个 智能 体 均 采 用 相同 假设 ， 且 二 "为 共同 知识 以 及 规划 ， 任 务 
和 智能 体 以 相同 排序 进行 总 排序 ， 即 可 直接 推导 而 得 。 

命题 8 ”如 果 规 划 p 是 合理 的 ， 则 对 于 智能 体 的 所 有 有 限 集 4 以 及 规划 p 中 
的 所 有 状态 z，4 与 递归 式 完备 分 配 RecTaskAlloc(z, B) 一 致 。 

证 明 : 根据 引 理 1， 在 给 定 相同 的 假设 条 件 下 ， 智 能 体 对 每 个 规划 类 型 计算 
可 得 相同 的 分 配 。 由 于 初始 假设 中 相同 ， 只 需 证 明 随 着 每 个 智能 体 递归 计算 分 
配 ， 以 同样 方式 来 更 新 假设 。 由 于 所 有 规划 仪 包含 局 部 规划 的 公式 和 效用 函数 ， 
因此 单个 分 配 不 依赖 于 其 他 单个 分 配 。 男 外 ， 由 于 规划 p 合理 ， 只 需 在 最 高 层 
( 即 对 于 PlanTypes(z) 中 的 规划 类 型 ) 调用 可 能 失败 的 NextAlloc。 由 于 所 有 智 
能 体 都 试图 对 PlanTypes(z) 中 的 所 有 规划 计算 一 个 分 配 ， 根 据 引 理 1， 这 些 智能 
体会 达成 一 致 。 

命题 9 ”如 果 规 划 p 是 完全 合理 的 ， 则 对 于 智能 体 的 所 有 有 限 集 4 以 及 规划 
p 中 的 所 有 状态 *，4 与 递归 式 完全 完备 分 配 RecTaskAlloc(z, B) 一 致 。 

证 明 : 类 似 于 命题 8 的 证 明 。 

当然 ， 这 些 条 件 只 有 在 智能 体 具有 相同 信念 基 时 相关 ， 而 这 在 现实 情况 下 是 
很 少 发 生 的 。 信 念 冲突 很 容易 导致 冲突 分 配 。 在 第 6 章 ， 将 介绍 如 何 检 测 和 消解 
冲突 。 

递归 式 任务 分 配 作为 一 个 重要 工具 ， 下 节 将 介绍 pALICA 中 基于 规则 的 操作 
语义 。 接 下 来 ， 用 TAlloc(a, P, Al F) 来 表示 信念 状态 .上 下 智能 体 集 合 4 中 智 
能 体 a 对 规划 类 型 P 的 任务 分 配 结果 ,以 及 用 RecTAlloc(a, z! F) 表示 信念 状 
AF FERE a 对 状态 z 的 任务 分 配 结果 。 另 外 ， 用 上 表示 寻找 有 效 任务 分 配 失 
败 ， 例 如 ， 如 果 RecTAlloc(a, z| F) = 上 ， 则 表明 在 给 定 假设 条 件 大 下 对 状态 z, 
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没有 一 个 有 效 的 任务 分 配 。 

值得 注意 的 是 ， 在 计算 分 配 时 并 没有 限制 是 否 需 要 完备 或 完全 完备 的 特性 。 
在 5.13 节 将 表明 ， 这 两 种 情况 都 可 用 于 相同 的 操作 规则 ， 这 取决 于 应 用 场景 以 
及 两 种 特性 所 用 的 规划 结构 。 


5.13 规则 


转移 规则 定义 了 在 单个 计算 步骤 中 智能 体 配 置 如 何 变化 。 每 条 规则 需 满足 一 
个 条 件 ， 并 将 一 个 给 定 配置 转化 为 新 配置 : 
条 


条 件 
E 

由 于 在 一 个 给 定 情 况 下 ， 可 能 会 利用 多 条 规则 ， 在 此 引入 优先 级 关系 。 该 优 
先 级 决定 了 在 一 组 应 用 规则 中 应 采用 哪 条 规则 。 如 果 规 则 7 比 规则 x 的 优先 级 更 
高 ， 则 记 为 ">r,。 规 则 的 优先 级 关系 ， 即 > 是 可 传递 和 非 对 称 的 。 

FH, a 表示 满足 转移 系统 的 智能 体 。 仅 当 条 件 满 足 时 才 应 用 规则 ， 即 智能 
体 配置 Conf(a) 与 转移 系统 的 左 侧 相 结合 且 没 有 可 应 用 的 更 高 优先 级 的 规则 。 

在 此 区 分 两 种 类 型 的 转移 规则 : 描述 智能 体 正 常 操作 的 操作 规则 和 提供 从 故 
障 中 恢复 方法 的 修复 规则 。 首 先 从 Init 规则 开始 执行 一 个 ALICA 程序 ， 然 后 
Trans 和 STrans 规则 描述 智能 体 如 何 对 规划 中 的 转移 做 出 反应 。Trans 主要 反映 正 
常 转移 的 情况 ， 而 STrans 反映 了 同步 转移 的 情况 ， 这 需要 在 所 有 参与 机 器 人 之 
间 建 立 共同 信念 。 之 后 是 应 用 Alloc 规则 ， 该 规则 是 对 进入 新 状态 的 机 器 人 进行 
递归 式 任务 分 配 。 最 后 ， 根 据 来 自 较 低层 (BSuccess) 的 成 功 信号 以 及 在 规划 中 
达到 成 功 状态 (TSuccess) ， 利 用 BSuccess 和 TSuccess 规则 来 调整 智能 体 的 配置 。 
在 任何 时 刻 ， 利 用 Sense 规则 来 表示 在 信念 基 中 集成 了 新 的 感知 信息 。 

原则 上 ， 这 7 条 规则 已 足以 描述 智能 体 的 操作 行为 ， 除 非 发 生 故 障 ， 利 用 修 
复 规则 来 进行 故障 处 理 。 在 此 ， 提 出 了 一 组 修复 规则 (10 条 ) 来 表示 对 故障 的 
不 同 反应 。 由 于 某 些 规则 并 不 能 应 用 于 任何 领域 ， 因 此 修复 规则 在 某 种 程度 上 是 
域 相 关 的 。 规 则 系统 意味 着 仅 适 用 于 某 个 域 的 特定 需要 。 

BAbort 规则 是 用 于 当 出 现 故 障 时 来 终止 正在 执行 的 行为 。BRedo 和 BProp 规 
则 来 处 理 故 障 。 如 果 可 能 的 话 ，BRedo 试图 重新 执行 发 生 故 障 的 行为 ， 而 BProp 
将 该 故障 向 上 传递 给 包含 行为 执行 发 生 故 障 的 规划 。PAbort 对 规划 的 作用 类 似 于 
BAbort 对 行为 的 作用 ， 即 终止 发 生 故 障 的 规划 以 及 与 其 有 关 的 所 有 规划 和 行为 。 
然而 如 果 可 能 的 话 ， 可 由 将 失败 规划 中 的 智能 体 状 态 进行 重 置 的 PRedo 来 代替 。 
这 样 可 避免 计算 和 通信 的 开销 ， 因 为 智能 体 还 继续 执行 任务 ， 而 无 需 重 新 计算 一 
个 新 的 分 配 。 
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在 无 法 利用 PRedo 进行 “ 软 ” 重 启 且 PAbort 终止 执行 规划 的 情况 下 。PRe- 
place 规则 触发 一 个 新 的 任务 分 配 ， 这 个 新 的 任务 分 配 也 可 从 相应 的 规划 类 型 中 
重新 选择 一 个 规划 。 其 他 所 有 故障 处 理 方 法 都 不 可 行 时 ，PProp 将 该 故障 向 上 传 
播 到 父 规 划 。 最 后 ，PTopFail 检测 到 顶层 规划 失败 的 情况 ， 然 后 通过 Init 规则 来 
重新 初始 化 。 

另外 还 有 三 种 特殊 规则 。NExpand 规则 是 当 无 法 完成 一 个 预期 的 任务 分 配 时 
触发 故障 ，Adapt 规则 是 用 于 定期 检查 任务 分 配 的 效用 值 ， 并 在 当前 效用 值 不 再 
满足 时 执行 任务 的 重 分 配 ， 因 此 Adapt 可 用 于 高 动态 变化 的 分 配 ， 以 适应 环境 的 
快速 变化 。 最 后 ，RoleAlloc 规则 用 于 处 理 角色 分 配 和 重 分 配 。 由 于 重 分 配 通 常 
发 生 在 团队 组 成 或 某 些 功 能 发 生变 化 的 情况 ， 因 此 也 可 将 其 看 作 一 种 修复 规则 。 
5.13.1 操作 规则 

通常 ， 操 作 规 则 的 优先 级 要 高 于 修复 规则 ， 这 是 基于 通过 改变 智能 体 配置 ， 
使 得 故障 可 能 无 关 紧 要 的 思想 。 修 复 规 则 是 为 了 保持 某 种 特定 状态 或 为 当前 执行 
但 失败 的 意图 提供 另外 一 种 选择 。 这 也 可 人 允许 通过 指定 一 个 转移 条 件 下 的 失败 子 
规划 来 进行 特定 域 的 故障 处 理 。 

初始 化 规则 


Init: 


i 
(B,®,E,R)—(B + |In(a,Po,To,Zot , Alloc (zo) | ,| (po,To.%0) | ,P,R) 
从 直观 上 看 ， 初 始 化 规则 要 求 智能 体 开 始 执行 规划 树 。 这 可 能 是 由 于 启动 后 
智能 体 的 规划 基 为 空 或 由 于 规划 失败 造成 智能 体 的 规划 基 完 全 为 空 
感知 规则 


Sense( 中 ) 
"(B,Y,E,R)—>( (有 + 中 ) ,V,E,R) 


感知 规则 将 感知 信息 集成 到 信念 基 。 特 定 谓词 Sense(4$) 表示 所 获得 的 感知 
言 息 。 假 设 通信 信息 也 是 以 同样 方式 来 集成 ，ALICA 中 智能 体 之 间 交 换 的 一 个 
关键 消息 是 定期 ( 半 定 期 ) 广播 规划 基 信 息 和 成 功 信 息 。 该 消息 中 包含 了 对 智 
能 体 a 的 规划 基 中 每 个 三 元 组 (p, r, z) 形式 为 In(a, p, 7, z) 的 信念 和 对 不 
在 该 规划 基 中 的 每 个 三 元 组 形式 为 Im (a, p, T, z) 的 负 信 念 。 这 样 就 可 通过 
对 智能 体 a ERR In(a, p, 7, z) 中 的 所 有 信念 来 更 新 信念 基 ， 并 增加 在 随后 所 
接收 的 消息 中 所 包含 的 信念 。 对 于 成 功 信息 也 可 用 相同 方法 处 理 。 

大 多 数 感 知 信息 应 由 ALICA 之 外 的 感知 部 件 来 处 理 ， 并 相应 地 更 新 智能 体 
的 信念 状态 ， 如 5. 2 节 所 述 。 在 此 ， 出 于 完备 性 起 见 ， 仅 列 出 该 规则 ， 使 得 可 利 
用 规则 来 描述 所 有 相关 的 更 新 。 

转移 规则 

转移 规则 控制 智能 体 何 时 以 及 如 何 从 一 个 状态 转移 到 另 一 个 状态 。 


Sense; 
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BF 人 (Pp,T,z) EVA (z,2',6) EWA_( dseA)(z,2',b) ss 
(B,Y,E,R)—((B-0; ) +0; ,(1%-8, ) UD ,E',R) 
式 中 V; ={In(a’,p,r,z)|BEIn(a’,p,7,z)} U{In(a’,p’,7',2”) la'e ANp'e 
Plans* (z) Az” e States(p’) } ; 
0; =| In(a’,p,7,z') IIn(a',p,7,z) eB; | U{ Alloc(z’)} ; 
OF =| (p,T,z')}; 
0; = {(p,7,z)} UPlans* (7,z) ; 
E' =E—{(b,2")\(p’,r’,2") ed |。 
如 果 智 能 体 当 前 处 于 状态 z 且 认 为 已 满足 转移 条 件 5， 则 将 按照 一 个 外 部 转 
移 从 状态 2 转移 到 z。 另 外 ， 该 转移 必须 不 属于 同步 集 。 发 生 转 移 之 后 应 保证 智 
能 体 终止 执行 与 状态 zz 相关 (BI Plans (y, z) 中 ) 的 所 有 规划 和 行为 。 在 信念 
基 中 增加 Alloc( 2’) 可 满足 相对 于 新 进入 状态 z 的 任务 分 配 需要 。 值 得 注意 的 
是 ， 应 用 该 规则 的 智能 体 还 假设 处 于 状态 z 下 的 每 个 其 他 智能 体 也 应 用 该 规则 ， 
即 认为 满足 其 前 置 条 件 。 通 过 一 个 规划 树 可 实现 对 其 他 智能 体 的 局 部 跟踪 。 
同步 转移 规则 
同步 转移 规则 用 于 处 理 同步 集中 的 转移 。 直 观 上 ， 一 个 同步 转移 对 合作 行为 
的 启动 进行 建 模 ， 该 合作 行为 取决 于 所 有 参与 智能 体 在 非常 短 的 时 间 帧 内 动作 。 
时 间 帧 的 上 限 取决 于 通信 的 延迟 和 可 靠 性 ， 以 及 智能 体 跟踪 其 队友 意图 的 精确 
度 。 在 最 坏 的 情况 下 ， 无 法 建立 满足 同步 转移 规则 的 条 件 。 
ACA)aeA seEA)(z,z',b) es 
STs eRe Hy at (B oe a Geer FS 
AP (p,7,z) er; 
y =( Y (2",2"",6;) es)( da’ €A,r' € Tasks(p) ) Bt MBel, (In(a',p,r',z”) 
人 中 ) ; 
Br = {In(a',p,r’,z") la’ eAAr' eT Az" &States(p) | U}In(a’,p’,7r',2”) | 
a’ cA (BE In(a’,p,r’,2”)) Ap’ & Plans* (z)}; 
Vi ={In(a’,p,7r’,2"") la’ EAA (Bt In(a’,p,7r’,2”)) A (2",2"",6) es} U 
| Alloe(z’) } ; 
OF =1(p,7.2') } 3 
v; ={(p,7,z) | UPlans* (7,2) ; 
E' =E —-{(b,z)\(p,7,z) ed lo 
EI, RAHE RE a 确认 其 是 智能 体 组 4 中 的 成 员 时 才 会 进行 同步 转移 ， 
使 得 该 智能 体 a 认为 在 所 有 满足 相关 条 件 $; 的 集合 4 中 具有 一 个 共同 信念 。 而 
H a 还 必须 认为 所 有 处 于 正确 状态 的 集合 4 中 的 智能 体 具有 一 个 共同 信念 ， 也 就 
是 说 ， 同 步 集 中 的 每 个 转移 都 将 由 一 个 智能 体 采用 。 因 此 ， 在 进行 同步 转移 的 过 


Trans: 
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程 中 具有 一 个 针对 个 体 意图 的 共同 信念 。 如 果 智 能 体 认为 该 条 件 满足 ， 则 将 以 正 
常 转移 规则 的 方式 进行 动作 。 另 外 ， 还 假设 所 有 参与 智能 体 都 这 么 进行 。 

同步 转移 规则 比 正 常 转 移 规 则 的 优先 级 高 ， 即 STrans > Trans。 这 是 根据 同 
步 实现 规 划 对 整个 团队 的 作用 更 大 且 实 现 难度 更 大 的 思想 。 显 而 易 见 ， 如 果 不 排 
除 同步 操作 (一 (seA)(z,z' ,4) ss) 的 话 ，Trans 的 条 件 可 纳入 STrans 的 条 件 。 


顾名思义 ， 同 步 操作 实现 了 智能 体 之 间 的 紧 耦 合 。 通 过 相互 之 间 的 通信 可 建 
立 共同 信念 〈 详 见 7.5 节 ) 。 在 某 些 情况 下 ， 根 据 通信 介质 的 质量 和 负荷 ， 可 能 
会 适得其反 。 在 这 种 情况 下 ， 可 在 普通 转移 的 基础 上 采用 弱 同 步 的 方式 。 假 设 要 
同步 实现 两 个 转移 (2, 5, >) 和 (z3，z4， 由 )。 假 设 z,，z 均 不 是 初始 状态 ， 
且 没 有 产生 或 的 其 他 转移 ， 则 可 通过 用 $AwV (Aa, p, 7)In(a, p, T, 
z) MR OIF bAWV (Aa, p, 7)In(a, p, T, =) 替换 消 来 实现 一 个 类 似 于 
同步 但 又 并 非 那么 严格 的 行为 ， 这 样 智能 体 就 可 依次 实现 同步 转移 。 这 种 弱 同 步 
只 需要 一 条 消息 ， 但 更 容易 受 包 丢失 或 延迟 的 影响 。 

分 配 规则 

分 配 规则 用 于 智能 体 按 上 述 转移 规则 发 生 转移 之 后 的 情况 。 通 常 当 智能 体 刚 
刚 进 入 一 个 状态 时 ， 该 规则 即 可 执行 任务 分 配 : 

Alloc: (Bt Alloe(z) \In(a,p,7,z) ) ARecTAlloc(a,z|B) #1 
*(B,Y,E,R)—((B - | Alloc(z) |) +0; YUO ,FEUD ,R) 
式 中 9 =RecTAlloc(a,z|B) ; 
OF = 1 {pT 52’) |In(a,p',7’,z') evt}; 
o* ={(b,z') |((p,7,z’) eÙ; Vz =z) Abe Behaviour(z’) 上。 

tHE DL, AT ELK a 认为 对 于 状态 z 需要 或 可 能 执行 一 个 任务 分 配 ， 则 将 
根据 5. 12 节 所 述 ， 通 过 计算 分 配 RecTAlloc(a, z|B) 来 更 新 其 信念 基 ， 然 后 将 
其 涉及 的 所 有 规划 都 增加 到 规划 基 中 ， 并 开始 执行 所 有 与 增加 的 规划 一 任务 一 状 
态 三 元 组 相关 的 行为 。 

由 于 直到 智能 体 离开 相应 的 状态 ， 分 配 结果 都 是 唯一 相关 的 ， 因 此 转移 规则 
要 比分 配 规则 具有 更 高 的 优先 级 ， 即 Trans > Alloc 

行为 成 功 规则 

在 ALICA 中 , 行为 是 不 可 分 的 动作 ， 在 执行 过 程 中 的 任何 时 刻 都 可 能 失败 
或 成 功 。 这 可 由 Success(b) 和 Fail(b) 来 反映 ， 其 中 为 所 讨论 的 行为 。 由 于 6 
内 置 在 一 个 规范 的 行为 规划 或 具有 类 似 特性 的 规划 中 ， 通 过 转移 规则 ， 智 能 体 将 
依次 进入 该 规划 的 成 功 状 态 : 


eee (b,z) e E AB F Success(b) 
(B, Y,E,R)—>(B,Y,E- |(b,z)] ,R) 


b 发 生动 作 的 状态 。 
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如 果 成 功 执行 一 个 动作 行为 ， 则 该 行为 结束 。 根 据 规划 公理 ， 同 时 也 满足 其 
后 置 条 件 。 由 于 该 规则 只 是 处 理 信 号 并 相应 地 更 新 执行 集 ， 因 此 其 优先 级 要 高 于 
之 前 修改 规划 基 的 Trans 和 Alloc 规则 。 

任务 成 功 规则 

当 且 仅 当 智能 体 达 到 状态 z © Success(p ) ， 才 能 成 功 地 完成 规划 中 的 一 个 
任务 : 


(p,7,z) eY Aze Success(p) 
(B,Y,E,R)—(B +8; ,Y,E,R) 


式 中 3; = | Succeeded(a, p, 7), Post(z)|, 

通过 将 后 置 条 件 与 达到 终止 状态 相关 联 ， 该 规则 来 更 新 信念 基 。 同 时 还 记录 
了 成 功 完 成 p 中 的 任务 r。 

如 果 由 于 基数 &，(p，T，B +3; ) 改变 而 不 再 满足 TeamIn(p)， 则 该 更 新 可 
能 会 导致 一 个 不 一 致 的 分 配 。 随 后 根据 自 适 应 规则 的 一 个 任务 重 分 配 可 对 智能 体 
a 进行 相应 的 重 分 配 ， 除 非 在 父 层 上 的 一 个 转移 作用 于 任务 的 成 功 完 成 。 任 务 成 
功 完成 需要 与 执行 规划 p 的 其 他 智能 体 相互 通信 ， 否 则 一 旦 智能 体 a 本 身 作 用 于 
成 功 ， 就 可 能 由 于 执行 规划 的 智能 体 个 数 不 够 而 放弃 执行 ( 见 示例 5.3)。 这 样 ， 
一 个 智能 体 就 负责 通知 其 团队 由 Succeeded (a, p, 7) 表示 的 类 似 于 联合 意图 的 
实现 目标 。 

在 此 ， 优 先 权 优 先 赋 于 较 低 层次 行为 的 成 功 实现 ,但 仍 认 为 该 成 功 规则 比 转 
移 规 则 有 具有 更 高 的 优先 权 ， 即 BSuccess > TSuccess > STrans。 这 样 ， 对 一 个 转移 
规则 的 检查 可 作用 于 任务 的 成 功 执行 。 

示例 5.3 (异步 规划 成 功 ) 该 示例 表明 在 执行 某 一 规划 的 男 一 个 任务 
之 前 ， 应 先 完成 同一 规划 中 的 一 个 任务 。 如 上 所 述 , 任务 的 成 功 完成 会 体现 
在 信念 基 中 ， 并 与 其 他 智能 体 相互 通信 。 图 5.4 给 出 了 这 种 情况 。 最 初 ， 两 
个 智能 体 a 和 4 分 配给 规划 p, 中 的 任务 7, 和 7,。 两 个 任务 者 有 一 个 关联 基数 
1. . 1， 表 示 在 执行 规划 时 只 能 给 每 个 任务 分 配 一 个 智能 体 。 两 个 智能 体 都 从 
该 规划 中 各 自任 务 的 初始 状态 开始 。 智 能 体 a 执行 规划 类 型 P., RE b H 
行规 划 类 型 P, 。 经 过 一 段 时 间 ， 智 能 体 转移 到 下 一 状态 >， 。 而 智能 体 " 在 
经 过 转移 后 从 状态 s; 到 达成 功 状态 4:。 这 时 ， 智 能 体 2 执行 完 规 划 ， 因 此 也 
不 再 继续 执行 任务 rx 。 如 果 尚 未 记录 成 功 实现 任务 r ， 则 可 能 由 于 不 满足 任 
务 基数 而 放弃 规划 。 参 见 Teamin 的 定义 (定义 5.12)。 通 过 发 布 成 功 消息 ， 
假设 任务 +, 是 Required(p,) 中 的 唯一 任务 ， 则 智能 体 a 也 由 于 pi 已 成 功 实 
现 而 将 放弃 执行 规划 。 


TSuccess: 


1. 任 务 分 配 2. 开 始 执行 3. 智 能 体 b 成 功 完成 


图 5.4 异步 规划 成 功 示 例 


5.13.2 ”修复 规则 

典型 的 BDI 语言 具有 故障 处 理 机 制 ， 如 由 于 智能 体 工 作 的 动态 环境 中 发 生 
不 可 预期 的 变化 。 经 典 的 BDI 语言 还 可 区 分 规划 失败 和 目标 失败 。 前 者 可 能 是 
由 于 与 某 些 边界 约束 冲突 而 导致 ， 后 者 是 由 于 目标 本 身 不 可 能 实现 而 导致 。 参 见 
Sardina 和 Padgham!" 给 出 的 示例 。 

尽管 目标 可 表示 为 适当 的 后 置 条 件 ， 但 在 仅 给 定 域 相 关 知 识 的 条 件 下 ， 
ALICA 不 具有 推断 目标 是 否 仍 可 实现 的 任何 推理 能 力 。 实 际 上 ， 利 用 运行 条 件 和 
失败 状态 等 规划 元 素来 表示 未 能 实现 目标 或 不 可 能 实现 目标 的 信念 

根据 应 用 场景 不 同 ， 经 常会 产生 相应 的 规划 失败 概念 。 例 如 ， 在 机 器 人 足球 
动态 领域 ， 每 个 机 器 人 应 对 队友 的 状态 作出 假设 ， 由 此 来 证 明 是 错误 的 。 修 复 规 
则 是 一 种 特殊 的 转移 规则 ， 意 味 着 从 失败 或 故障 中 恢复 。 处 理 失败 的 方法 有 多 
种 ， 其 中 有 一 种 根据 域 的 特殊 方法 。 可 以 重新 尝试 一 个 失败 的 规划 ， 或 由 另 一 种 
规划 替换 ， 或 可 向 规划 树 传播 失败 。 在 某 些 语言 中 ， 如 AgentSpeak''” ， 甚 至 通 
过 失败 可 产生 某 一 特定 目标 ， 意 味 着 为 准确 处 理 所 发 生 的 故障 而 触发 一 个 自 定 义 
规划 。 

ALICA 具有 一 种 显 式 处 理 规划 失败 的 类 似 方法 。 首 先 确认 失败 的 规划 或 行 
为 ， 然 后 产生 一 个 相应 的 信念 并 增加 到 信念 基 中 (如 5.2.2 节 所 述 ， 对 规划 和 行 
HAAA Handle, (p) 和 Handle, (5b5，z) ) 。 由 于 转移 规则 的 优先 级 要 高 于 修复 
规则 ， 因 此 可 通过 转移 来 建 模 一 种 显 式 机 制 ， 否 则 进行 默认 处 理 。 

行为 中 止 规则 

如 果 产 生 一 个 故障 信号 ， 则 行为 中 止 ， 这 样 需要 从 执行 集中 去 除 该 行为 : 

(b,z) ©E ABE Fail(b) 
(B,Y,E,R)—(B’ ,Y,(E-}|(b,z)}),R) 
式 中 B’ =(B-|(Wi)Failed(b,z,i) ,Fail(b) | ) + | Failed(b,z,j) ,Handle,(b,z) | ; 
i i+l Failed (b,z,i) e B 
j=l; 其 他 。 
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Failed(6, z, i) 信念 用 于 记录 需 中 止 多 少 次 行为 ， 由 此 来 采用 不 同 的 失败 
恢复 规则 。 值 得 注意 的 是 ， 如 果 例 如 通过 转移 离开 相应 的 状态 xz， 则 降低 该 信念 
以 使 得 信念 基 与 ,保持 一 致 ( 见 定义 5.6)。 

行为 修复 规则 

行为 修复 规则 是 作为 一 种 处 理 行为 失败 的 默认 机 制 : 

BHFIn(a,p,7,z) MFailed(b,z,1) A Handle,(b,z) 
(B,Y,E,R)—(B',Y,E',R) 


BRedo: 


式 中 E'=EU]|(b,z)}; 
B' =B - | Handle,(b,z) } 。 
Bt In(a,p,7,z) A( di) Handle,(b,z) A Failed(b,z,i) Ai>1 
(B,Y,E,R)—(B',Y,E,R) 
式 中 B' =(B -— | Handle,(b,z) , Failed(b,z,i),( Wk) Failed(p,k) |) + | Handle, 
(p) ,Failed(p,j) | ; 
es yj +) Failed(p,j’) e B 
=f, 其 他 。 

如 果 可 能 的 话 ，BRedo 会 重新 执行 一 个 失败 的 行为 ， 并 且 如 果 开 始 尝 试 重新 执 
行 该 行为 ， 则 BProp 会 向 包含 该 行为 的 规划 传播 失败 。 在 (Vk) Failed(p, k) 中 
的 通用 量化 可 确保 无 论 当 前 天 值 多 大 ， 都 会 去 除 Failed(p,k)。 该 情况 是 每 个 规划 
p 最 多 满足 Failed(P, k) 的 一 个 实例 。 值 得 注意 的 是 ， 这 些 规则 的 适用 性 是 与 有 具 
体 的 应 用 域 有 关 。 例 如 ， 在 某 些 特定 场景 下 ， 重 新 尝试 一 个 失败 行为 可 能 没有 任何 
意义 。 而 在 其 他 情况 下 ， 成 功 完 成 某 一 行为 可 与 一 个 已 知 的 概率 分 布 相 关联 ， 这 时 
就 可 对 重 试 效用 进行 估计 。 因 此 ， 需 要 自 定义 这 些 域 相关 的 规则 。 

规划 中 止 规则 

规划 中 止 规则 与 行为 中 止 规则 非常 类 似 : 

(p,7,z) eY A (ze Fail(p) VBH Run(p) V — TeamIn(p) ) 
(B,Y,E,R)—>((B-0; ) +9; 7-0, ,E-0, ,R) 
式 中 37 = {In(a’,p,7’,z') la'e ANT'eT,z' eStates(p)| U{In(a’,p'’,r’,z’) | 
( 42” e States(p) )p’ e Plans* (z") | U | ( Vk) Failed(p,k) | ; 

v = | Handle,(p) ,Failed(p,j) | ; 

V; ={(p,7,z) | UPlans* (7,z) ; 

V; ={(b,z)1(p,7,z) ed; | ; 

iff #1 Failed(p,j’) e B 

mf 其 他 。 
若 与 相应 的 运行 条 件 相 冲 突 ， 或 到 达 一 个 失败 状态 ,或 智能 体 认 为 团队 已 不 再 执 
行规 划 ， 这 时 该 规则 就 中 止 。 另 外 ， 该 规则 会 中 止 执行 当前 状态 z 下 的 所 有 规划 


BProp : 


PAbort 
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和 行为 ， 并 假设 所 有 在 规划 p 中 执行 的 智能 体 都 可 检测 到 规划 失败 ， 而 且 采 用 相 
同 的 规则 。 如 果 某 个 参与 智能 体 没有 检测 到 失败 ， 就 会 产生 信念 冲突 的 状态 ， 即 
某 些 智能 体 仍然 认为 该 规划 可 继续 执行 ， 而 其 他 智能 体 则 认为 无 法 执行 。 解 决 该 
问题 需要 智能 体 将 相关 失败 信息 通知 给 团队 队友 。 定 期 广播 包括 足够 信息 的 规划 
基 可 推测 规划 失败 ， 或 对 缺失 的 智能 体 进行 补偿 。 在 7.5 节 中 ， 将 详细 讨论 这 些 
消息 。 
规划 修复 规则 
规划 修复 规则 以 默认 方式 处 理 失 败 规划 。 直 观 上 ， 一 个 规划 可 重新 执行 ， 或 
由 另 一 个 规划 替换 ， 或 向 上 传播 失败 : 
PTopFail ; Br Handle (py) 
“(BY ,E,R)—(B-|(Vp,7,z)In(a,p,7,z) ,Handle,(py) | ,B,D,R) 
PTopFail 通过 重 置 智 能 体 配 置 来 处 理 顶 层 规划 的 失败 ， 从 而 再 次 触发 Init 规 
则 。 解 决 该 层次 上 失败 的 唯一 方法 是 重新 执行 整个 程序 : 
(p,T,z) €PAzeFail(p) A(B}— ( dx) Failed(p,x)) AB’ ys 
(B,Y,E,R)—>(B',(Y-8, ) U{ (p,7,2') | ,£',R) 
stra OB’ =(B-0; ) + {In(a,p,7,2') ,Alloc(z’) ,Failed(p,1) | ; 
V; ={In(a,p,7,z)}U{In(a,p',r',z”) |r’ eT Ap’ © Plans* (y,z)}; 
z =Init(p,7); 
y =TeamIn(p) APre(p) A Run(p) ; 
v; ={(p,7,z) | UPlans (7,z) ; 
E' =E -|(b,z)\(p,7,2) ed, |o 
通过 采用 PRedo， 如 果 某 一 智能 体 已 处 于 失败 状态 ， 或 认为 其 团队 仍 继续 执 
行规 划 p， 或 仍 满足 前 置 条 件 和 运行 条 件 ， 则 该 智能 体 可 试图 完成 该 规划 p 中 的 
任务 。 值 得 注意 的 是 ， 需 要 智能 体 处 于 采用 RPedo 之 前 的 假设 条 件 B' 下 来 评估 
该 规则 的 条 件 。PRedo 要 比 PAbort 的 优先 级 更 高 ， 即 PRedo > PAbort， 因 此 首先 
应 尝试 计算 量 较 小 的 失败 处 理 。 由 于 已 将 Failed(p, 1) 增加 到 信念 基 中 ， 因 此 
PRedo 不 能 处 理 同 一 规划 的 后 续 失 败 。 处 理 顶 层 规划 的 失败 只 有 一 种 方法 ， 因 此 
PTopFail > PRedo : 


PRedo : 


BH Handle;( po ) A Failed(p,1) 
(B,Y,E,R)—(B',Y,E,R) 
式 中 BB’ =(B-|Handle,(p) | ) + | Alloc(z) } ; 
p e Plans(z). 
PReplace 是 通过 在 规划 p 执行 的 状态 下 触发 一 个 新 的 任务 分 配 来 处 理 失 败 : 
pw (Bt Handle/(p) MFailed(p,2)) A (p',7,z) eT 
Pi(B,T,E,0.R) OS((B-0) +0; ,7 -0 ,E-d ,0,R) 


PReplace: 
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式 中 pePlans(z); 
V; = |In(a',p',T',z)la'e ANT'eT} U]|In(a',p",T',z')I|( 42” e States 
(p') )p” & Plans * (z”)} U | ( Vk) Failed(p',k) | ; 
v; = | Handle,(p’) ,Failed(p’,j) | ; 
v; ={(p,7,z)} UPlans* (7,z) ; 


Of =| (b,z)1(p',7,z) eB; | ; 
a p +1 Failed (p',j') e B 
u 其 他 。 


智能 体 对 于 规划 失败 的 最 后 选择 是 将 该 失败 向 上 传播 ， 在 此 是 通过 中 止 父 规 
划 并 触发 相应 的 失败 处 理 规则 来 实现 的 。 由 于 失败 应 在 最 低层 上 进行 处 理 ， 因 此 
PReplace > PProp 。 

分 配 失败 规则 

分 配 失败 规则 是 用 于 处 理 一 个 任务 分 配 无 法 对 规划 分 配 任何 智能 体 的 情况 ， 
例如 不 能 满足 前 置 条 件 。 如 果 在 状态 z 下 的 分 配 失 败 ， 则 对 相应 的 规划 p 也 会 
失败 : 


NExpand~2Alloctz) ) ARecTAlloc(a,z|B) = 1 A (p,7,z) EV 


(B,Y,E,R)—>( (B-08; ) + 7-8; ,E-0; ,R) 
式 中 8; = |Alloc(z)} U{In(a’,p,r',z) |a’ AAT'eT} U|In(a',p',T',z')| 
( 3z" e States(p) )p’ e Plans* (2”)} U | ( V k)Failed(p,k)}; 
0; = | Handle,(p) ,Failed(p,j) | ; 
v; ={(p,7,z)} UPlans* (7,z) ; 
O ={(b,z) |(p,7,z) ed, | ; 


PN #1 Failed(p',j’) e B 
i= 其 他 。 
自 适 应 规则 


自 适应 规则 是 针对 规划 没有 失败 但 效用 估计 相对 较 低 的 情况 。 在 这 种 情况 
下 ， 如 果 智 能 体 认 为 存在 一 个 更 适合 于 当前 情况 的 分 配 ， 则 可 触发 一 个 新 的 任务 
分 配 。 这 样 就 会 产生 一 个 类 似 于 Nair 等 人 ” 提出 的 局 部 决策 的 任务 重 分 配 机 
制 。 但 不 同 的 是 ， 以 该 方式 进行 任务 重 分 配 可 有 效 集成 到 编程 语言 ， 并 可 在 无 需 
过 多 审议 的 情况 下 随时 进行 。 

若 一 个 新 分 配 的 效用 更 高 ， 那 么 就 可 用 这 个 新 的 分 配 来 替代 原来 的 分 配 。 为 
使 得 决策 更 加 稳健 ， 在 此 采用 一 个 特定 的 规划 阔 值 XpP) ， 只 有 当 两 个 分 配 的 效 
用 差 大 于 该 阀 值 时 ， 才 能 进行 任务 重 分 配 。 另 外 ， 还 采用 了 特定 规划 因子 w,(P) 
加 权 的 相似 性 度量 Sim(p，B，B') ， 使 得 不 同 的 重 分 配 必 须 具 有 更 高 的 效用 : 
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U(p,,) (B") —w,(p,)Sim(p, ,B",B) >U(p,) (B) +t(p.) 
(B,Y,E,R)—(B,,?.,E,,R) 


Adapt: 


其 中 ， 
智能 体 4 当前 所 处 的 状态 z: 
= {a’|In(a’,p,7,z) | 
智能 体 a 在 状态 z 下 执行 p, 或 被 动 参与 执行 p,: 
aeAM(BH-TeamIn(A,p.)) Ap, e Plans(z) 
规划 p, 和 pp, 属于 同一 规划 类 型 
p-eP Ap, eP 
PP. 为 重 分 配 中 子 分 支 的 规划 : 


= |p.| Ulp’|( 42’ eStates(p,))p’ e Plans* (z’) | 
B' 是 对 p. 及 其 子规 划 没 有 任何 假设 的 信念 
B' =(B-{In(a',p',r’,z') la’ eAAp’ eP] 
B" 是 结合 假设 B' 对 规划 类 型 P 的 任务 分 配 结果 : 
B" =B' + TAlloc(a,P,A, |B’) 
P, 是 有 效 任务 分 配 选 择 的 规划 : 
TAlloc(a,P,A, |B’) # L MB’”H-TeamIn(A,p,) 
A 表示 重 分 配 的 智能 体 ; 
= {a'|In(a’,p,,7',2') EBA — ( 42") In(a’,p,,7',2”") e TAlloc (a, 
P,A|B’)| 
B, 为 保持 不 变 的 子 分 支 的 信念 


B, = {In(a’,p’,7’,z') la’ eAAa’ gA, AIn(a’,p',7',z")eBAp’ =P | 

BULLE AF B, 不 冲突 的 信念: 

B" =B" - \In(a',p',7',z’) |( 3z")In(a’,p’,7’,z") eB,| 

了 ,为 新 的 信念 基 ， 其 中 包含 所 有 未 变化 的 信念 、 新 的 任务 分 配 以 及 智能 体 a 
认为 对 z, 至 少 重 分 配 一 个 智能 体 ， 即 经 重 分 配 后 a 所 处 于 状态 下 的 Alloc(z, ) : 


es B" UB, U | Alloc(z, ) | 中 
a aes 其 他 
其 中 : 


p =In(a,p,,7,,2z,) E(B” +B,) \( da In(a',p,,7,,2,) EB” 
针对 新 信念 的 规划 基 和 执行 集 : 

ry’ =r-1(p',7',z') |In(a,p’,7’,z’) €B, | 

E,=E-{(b,z') |(p',r’,z’) er} 
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如 果 智 能 体 在 该 规则 下 进入 一 个 新 状态 ， 则 可 在 新 规划 基 中 体现 : 

Ya EY'U | (Pasta rFn) [In(a,p, ,Ta Zn) eB,| 

Sim(p, F, G) 为 相似 性 度量 : 

a\In(a,p,7,z) eFA( jz')In(a,p,7,2’) eG 

PPEP : ia 人 | “aI |) j 

也 就 是 说 ， 如 果 在 当前 情况 下 ， 对 规划 类 型 P 的 一 个 新 的 任务 分 配 的 效用 
值 要 高 于 当前 分 配 ， 则 智能 体 采用 新 的 分 配 。 疹 值 :(p) 限制 了 该 规则 的 适用 范 
围 。 对 于 每 个 规划 p,，i(p) 和 w,(p) 都 是 具体 的 。 值 得 注意 的 是 ，p, 和 p, 可 以 是 
同一 规划 类 型 P 中 的 相同 规划 或 两 个 不 同 规 划 。 因 此 当 某 一 任务 分 配 不 可 行 或 
难以 实现 时 ， 该 规则 允许 智能 体 从 一 组 分 配方 案 切 换 到 男 一 种 方案 。 与 转移 规则 
类 似 ， 需 从 信念 基 、 规 划 基 和 执行 集中 去 除 当 前 分 配 。 同 时 与 任务 分 配 规则 相 类 
似 ， 可 直接 采用 新 分 配 。 由 于 当 与 运行 条 件 发 生 冲 突 时 ， 该 规则 还 实现 了 一 种 软 
修复 机 制 ， 因 此 要 比 所 有 修复 规则 的 优先 级 更 高 。 

言 念 更 新 的 定义 反映 了 变化 最 小 的 概念 ， 即 无 需 改 变 任 务 的 智能 体 也 不 会 改 
变 其 状态 。 一 旦 采用 Adapt 对 局 部 智能 体 进 行 重 分 配 ， 或 认为 已 重 分配 其 他 智能 体 
到 该 状态 ， 则 可 将 信念 Alloc(z, ) 添加 到 信念 基 ， 并 触发 随后 的 递归 式 任 务 分 配 。 

Adaptation 规则 可 使 团队 对 发 生变 化 的 情况 作出 快速 反应 。 根 据 阀 值 和 相似 
性 度量 ， 可 避免 产生 振荡 。 然 而 这 些 值 取 决 于 所 采用 的 效用 函数 ， 因 此 该 规则 是 
域 相 关 的 。 另 外 ， 这 些 阔 值 和 相似 度 权 重 还 可 对 分 别 每 个 规划 人 允许 或 禁止 用 于 动 
态 自 适应 。 通 常 ， 随 着 智能 体 逐 步 趋向 于 成 功 完成 任务 ， 整 个 效用 值 也 会 不 断 增 
大 。 在 给 定 成 功 完 成 的 回报 函数 条 件 下 ,实现 上 述 目 的 的 一 种 方法 是 采用 满足 
Bellman 方程 "的 效用 值 。 

角色 分 配 规 则 

角色 分 配 规 则 是 用 于 处 理 需 要 进行 角色 重 分 配 的 情况 。 根 据 队 形 F (ILEX 
5.15) 计算 重 分 配 ， 并 在 与 之 前 分 配 情况 不 同时 由 智能 体 采 用 : 
| |HasRole(a’,r) |HasRole(a',r) e B} #F( la’|In(a',po ,7o ,20) EB} ) 

(B,T,E,R)—((B’ -3 ) +8} ,7,E,R’) 
式 中 R’=|HasRole(a,r) | HasRole(a,r) eF(la’'|lIn(a’,po ,To0,20) eB|); 
V; =|( Va,r)HasRole(a,r)}; 
0; =F({a'| Inla’, Po, Toz) EB} )o 

如 5. 6 节 所 述 ， 只 有 在 由 于 智能 体 脱 离 或 加 入 团队 ， 或 由 于 某 个 智能 体能 力 
发 生变 化 而 造成 团队 组 成 发 生变 化 的 情况 下 才 进 行 角色 的 重 分 配 。 为 简单 起 见 ， 
在 规则 中 没有 明确 表示 出 相应 的 触发 条 件 。 

整个 团队 是 由 顶层 规划 中 处 于 孤立 状态 的 智能 体 集 合 在 一 个 智能 体 的 信念 
进行 表示 ， 即 |a'|In(a',po ,7o,zo)1。 由 此 ， 当 该 智能 体 集 合 发 生变 化 或 智能 体 


RoleAlloc : 
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得 知 任何 一 个 参与 智能 体 的 能 力 发 生变 化 时 ， 这 足以 验证 该 规则 的 适用 性 。 

总 之 ， 在 此 所 提出 的 修复 规则 可 构成 一 个 灵活 且 可 定制 的 系统 来 对 失败 作出 
反应 ， 从 而 使 得 对 于 变化 的 情况 ， 团 队 行 为 具有 重 棒 自 适应 性 。 表 5.5 中 按照 规 
则 的 优先 级 顺序 ， 对 所 介绍 的 规则 进行 了 简要 概括 。 


表 5.5 从 最 高 优先 级 到 最 低 优 先 级 的 pALICA 操作 规则 


Init 初始 化 或 重新 初始 化 智能 体 配置 

RoleAlloc 根据 一 个 新 计算 的 角色 分 配 来 更 新 智能 体 的 假设 角色 

Sense 将 新 的 感知 信息 集成 到 信念 基 

BSuccess 对 行为 成 功 完成 作出 反应 

TSuccess 对 任务 成 功 完 成 作出 反应 

STrans 建立 一 个 合适 的 共同 信念 之 后 ， 使 得 智能 体 沿 同步 转移 运动 
Trans 智能 体 从 一 个 状态 运动 到 另 一 个 状态 

Alloc 在 智能 体 进入 的 状态 中 实现 递归 式 分 配 

Adapt 若 相应 任务 分 配 的 效用 值 之 差 较 大 ， 则 用 新 的 任务 分 配 代替 当前 的 任务 分 配 
BAbort 中 止 一 个 失败 行为 的 执行 ， 并 设置 相应 标志 

BRedo 如 果 可 能 ， 重 新 执行 失败 行为 

PTopFail 处 理 顶 层 规划 po 失败 的 情况 

PRedo 如 果 可 能 ， 重 新 执行 一 个 失败 规划 中 的 任务 

PAbort 中 止 一 个 失败 规划 的 执行 

PReplace 通过 触发 父 状 态 中 的 一 个 新 的 任务 分 配 来 代替 失败 规划 
PProp 将 失败 规划 传播 到 其 父 规划 

NExpand 无 法 计算 一 个 失败 规划 的 有 效 任务 分 配 


从 满足 执行 一 个 ALICA 程序 所 需 的 最 小 规则 集 的 意义 上 ， 在 此 所 提出 的 规 
则 集 并 非 一 个 最 小 集 。 例 如 ，PRedo 和 BRedo 规则 并 不 是 必需 的 ， 或 Alloc 和 
Adapt 规 则 可 合并 为 一 个 规则 。 然 而 该 规则 集 比 最 小 规则 集 更 易于 修改 ， 例 如 在 
无 需 动 态 自 适应 或 甚至 适 得 相 反 的 域 中 ， 可 很 容易 地 去 除 Adapt 规则 。 


5.14 智能 体 配 置 一 致 性 


本 节 将 验证 定义 5.4 中 所 介绍 的 规划 基 公 理 的 操作 语义 ， 另 外 还 表明 智能 体 
的 规划 基 总 是 构成 一 个 包括 所 有 行为 的 树 型 结构 ， 即 与 所 执行 行为 相关 的 均 在 规 
划 基 中 ， 并 且 智 能 体 总 是 信任 其 所 进行 的 工作 。 根 据 定义 5.8， 最 后 一 个 特性 是 
信念 基 所 需 的 。 

根据 定义 5. 8 ， 一 个 信念 基 需 要 与 共同 知识 和 规划 基 保 持 一 致 。 
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命题 10 ”如 果 Conf(a) =(B,Y,E,R)， 则 当 目 仅 当 BHFIn(a,p,7,z) 时 ，(p,7,z) 
EYo 

证 明 : 初始 的 信念 基 中 并 不 包含 In(a,p,7,z) 形 式 的 任何 信念 ， 且 根据 定义 
5.2， 初 始 规划 基 为 空 。 调 整 规划 基 的 每 个 规则 也 会 等 效 地 更 新 信念 基 。 

由 此 ， 信 念 基 与 规划 基 保 持 一 致 ， 且 智能 体 总 是 信任 其 所 要 进行 的 工作 。 如 
5.2.3 节 所 述 ， 可 通过 信念 更 新 语义 来 保持 共同 知识 的 一 致 性 。 

命题 11 ”如 果 程 序 结构 良好 ， 在 运行 期 间 产生 的 所 有 规划 基 中 ， 每 个 规划 
p 至 多 包含 一 个 三 元 组 (p, T, z)o 

WEH: 下 面 ， 假 设 一 个 满足 每 个 规划 中 至 多 包含 一 个 三 元 组 的 规划 基 。 初 始 
的 规划 基 为 空 ， 因 此 满足 该 特性 ， 然 后 通过 应 用 一 些 规则 对 规划 基 进 行 修 改 。 利 用 
Init 规则 对 初始 的 空 规划 基 增 加 一 个 三 元 组 ， 因 此 产生 一 个 符合 要 求 的 规划 基 。 

Sense, TSuccess, BAbort, BRedo, BProp, BSuccess, PReplace 和 RoleAlloc 
规则 并 不 会 修改 规划 基 。PAbort、PTopFail、PProp 和 NExpand 规则 只 是 从 规划 基 
中 去 除 三 元 组 ， 同 样 也 满足 要 求 。PRedo 规则 对 规划 基 增 加 了 一 个 三 元 组 
(p, T, 2’) ,但 同时 会 去 除 (p， +，z) ， 从 而 也 满足 要 求 。 

Trans 和 STrans 规则 会 去 除 转移 发 生 时 规划 p 和 状态 z 中 的 三 元 组 ， 以 及 属 
于 分 支 Plans* (2) 的 所 有 三 元 组 ， 而 只 增加 一 个 规划 p 的 新 的 三 元 组 。 这 样 如 果 
输入 规划 基 满 足 要 求 ， 则 这 两 个 规则 都 会 产生 符合 要 求 的 规划 基 。 

Alloc 规则 用 于 递归 式 任务 分 配 ， 并 将 所 得 的 三 元 组 增加 到 规划 基 。 由 于 程 
序 为 树 形 结构 ,递归 式 任务 分 配 算法 对 每 个 规划 一 次 至 多 分 配 一 个 智能 体 ( 根 
据 命 题 3)， 并 考虑 当前 信念 ， 该 信念 满足 命题 10 中 的 输入 规划 基 ， 则 如 果 相 应 
的 输入 规划 基 满 足 要 求 ，Alloc 规则 所 产生 的 所 有 规划 基 也 都 会 满足 要 求 。 

在 对 局 部 智能 体 进行 重 分 配 时 ，Adapt 规则 会 去 除 子 分 支 相 关 的 所 有 信念 ， 
随后 还 会 去 除 规划 基 中 的 相应 三 元 组 。 由 于 TAlloc(a,4,PI 大 ) 只 会 产生 规划 P 
的 有 效 分 配 ， 因 此 所 增加 的 唯一 三 元 组 是 针对 智能 体 进入 的 新 状态 。 如 果 增 加 了 
该 三 元 组 ， 则 与 之 前 执行 规划 有 关 的 任何 三 元 组 都 会 被 去 除 。 因 此 ， 该 命题 对 于 
Adapt 规则 同样 满足 。 

命题 11 是 规划 基 在 任何 时 候 构成 一 个 树 型 结构 的 必要 条 件 ， 但 不 是 充分 
条 件 。 

命题 12 ”对 于 规划 基 y 中 的 任何 元 组 (P，7，z) ; 

© p=po; 

© 规划 基 y 中 的 其 他 元 组 (p'，7'，z') 使 得 pePlans (2'). 

证 明 : 下 面 ， 假 设 一 个 符合 要 求 的 规划 基 。 初 始 的 规划 基 为 空 ， 因 此 满足 要 
求 。Init 规则 会 对 初始 的 空 规划 基 增 加 一 个 元 组 (Po, To, zo), ， 同 样 也 满足 该 命 
题 。Sense、TSuccess 、BAbort 、BRedo 、BProp BSuccess, PReplace 和 RoleAlloc 
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规则 均 不 会 修改 规划 基 。Trans 和 STrans 规则 会 去 除 智能 体 离开 状态 时 所 执行 的 
所 有 三 元 组 ， 从 而 也 满足 该 命题 。 

由 于 RecTAlloc 仅 产 生 有 效 的 递归 式 任务 分 配 ， 因 此 Alloc 规则 会 对 规划 基 
增加 一 个 完整 的 分 支 。Adapt 规划 在 规划 类 型 P 中 重新 分 配 。 在 规划 基 中 去 除 完 
整 分 支 ， 并 增加 一 个 规划 p, 的 三 元 组 。 由 于 p, 与 所 替换 的 规划 p, 都 属于 同一 规 
划 类 型 ， 并 且 三 元 组 (p, T, z) 保持 不 变 ， 因 此 所 得 的 规划 基 仍 满足 要 求 。 

PAbort 、PProp 和 NExpand 规则 会 去 除 中 止 规划 中 所 执行 的 所 有 规划 。PTop- 
Fail 规则 会 产生 一 个 空 的 规划 基 。PRedo 规则 会 去 除 (p, T, z) 以 及 状态 z 相关 
的 所 有 元 组 ， 并 增加 一 个 三 元 组 (P，7，Pit(P，7r) ) 。 这 样 如 果 输入 规划 基 满 
足 命 题 要 求 ， 则 所 得 的 规划 基 也 同样 满足 。 

定理 5.1 如 果 ALICA 程序 结构 良好 ， 则 运行 过 程 中 的 所 有 规划 基 会 构成 
一 个 树 型 结构 。 

证 明 : 根据 命题 11 和 命题 12， 以 及 一 个 结构 良好 的 程序 要 求 规划 树 为 一 个 
树 形 结构 ， 可 证 明 该 定理 成 立 。 

要 求 规划 基 构 成 一 个 树 型 结构 的 特性 非常 重要 ， 由 此 可 简化 推理 ， 人 允许 通过 
合适 的 数据 结构 来 实现 ， 并 有 助 于 高 效 遍历 和 规则 应 用 。 

在 给 定 规划 基 为 树 型 结构 的 条 件 下 ， 可 保证 该 规划 基 满 足 规划 基 公 理 ( 见 
定义 5.4): 

定理 5.2 如果 ALICA 程序 的 结构 良好 ， 则 运行 过 程 中 的 所 有 规划 基 均 满 
FE RUM SEAS EY 

证 明 : 根据 命题 11 ， 可 表明 满足 公理 5.1。 另 外 ， 由 于 下 列 原 因 ， 可 满足 公 
FHS. 2: 

@ po 不 属于 程序 树 中 的 一 个 规划 类 型 ， 否 则 程序 不 能 构成 一 个 树 型 结构 ， 因 
此 Init 规则 满足 。 

o 由 于 程序 构成 了 一 个 树 型 结构 ，RecTAlloc 仅 针对 每 个 规划 类 型 中 的 一 
规则 进行 分 配 。 

@ 如 果 Adapt 规则 增加 一 个 三 元 组 ， 则 会 去 除 之 前 所 执行 规划 的 三 元 组 。 

o 没有 其 他 规则 可 以 开始 执行 一 个 新 规划 ， 即 增加 一 个 元 组 (p, T, z), 
从 而 在 输入 规划 基 中 没有 三 元 组 (p, 7’, 2’). 

由 于 下 列 原 因 ， 可 满足 公理 5. 3; 

@ 空 规划 基 满 足 公 理 。 

@ 三 元 组 (Po, To, z2) 满足 公理 的 条 件 。 

@ 仅 当 对 于 由 存在 转移 (z, z', p) WY, Trans 和 STrans 规则 才 会 去 除 三 元 
组 (p, T, z), IAITH (p，r,，z ) ， 因 此 这 两 个 规则 都 满足 要 求 。 

o 任务 分 配 算法 仅 针对 相应 规划 的 任务 进行 分 配 ， 即 Tasks(p) 中 的 一 个 元 
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素 ， 且 仅 在 初始 状态 下 进行 分 配 ， 因 此 Adapt 和 Alloc 规则 满足 要 求 。 

@ 没有 其 他 规则 会 改变 智能 体 的 任务 或 对 于 某 个 规划 p 和 某 个 任务 7 增加 一 
个 (p, T, Init(p, 7)) 之 外 的 三 元 组 ， 从 而 使 得 (p, 7, 2) 处 于 某 个 状态 z 下 
的 输入 规划 基 中 。 

除了 满足 规划 基 ， 还 要 保证 机 器 人 只 会 执行 其 想 要 进行 的 动作 。 也 就 是 说 ， 
机 器 人 只 能 执行 由 规划 基 表 示 的 反映 过 程 意图 的 行为 。 

命题 13 ”没有 一 个 行为 是 孤立 的 。 对 于 运行 过 程 中 的 任 一 智能 体 配 置 (B, 
Y, E, R), WH: 

(V(b,z) ©F)( Ap,r)(p,7,z) er 

证 明 : 通过 Alloc 和 BRedo 规则 可 将 行为 增加 到 执行 集 。BRedo 规则 要 求 通 
过 In(a,p,7,z) 使 得 智能 体 处 于 相应 状态 ， 而 Alloc 规则 只 增加 元 组 (b, z), M 
而 使 得 一 个 相应 的 三 元 组 (p, r, z) 会 同时 增加 到 规划 基 中 。 

通过 Trans, STrans, PAbort, PTopFail, PRedo, PProp, NExpand 和 Adapt 规 
则 ， 会 在 规划 基 中 去 除 三 元 组 。 除 了 会 产生 一 个 空 执 行 集 的 PTopFail 规则 外 ， 上 
述 这 些 规则 都 会 从 针对 规划 基 中 所 去 除 元 组 的 状态 下 的 执行 集中 去 除 所 有 元 组 。 

随后 ， 如 果 一 个 行为 是 在 状态 z 下 进行 ， 则 智能 体 也 认为 其 处 于 状态 zo 


5.15 本章 小 结 


本 章 介 绍 了 pALICA 语言 的 形式 化 语义 。 在 此 讨论 了 一 个 语义 表示 的 智能 体 
模型 ， 这 是 通过 一 个 由 信念 基 、 规 划 基 、 执 行 集 和 角色 集 构成 的 智能 体 配 置 。 信 
念 基 反 映 了 智能 体 所 具有 关于 环境 及 其 团队 的 当前 信息 。 对 于 所 执行 的 ALICA 
程序 ， 智 能 体 的 内 部 状态 是 由 构成 智能 体 意图 的 过 程 描述 的 规划 基 来 表示 的 。 执 
行 集 是 由 智能 体 当 前 执行 的 行为 组 成 的 ， 从 而 与 底层 执行 部 件 相 关联 。 最 后 ， 角 
色 集 包含 了 团队 中 一 个 智能 体 可 能 具有 的 所 有 角色 。 

通过 一 个 详细 描述 了 智能 体 配置 如 何以 及 何 时 更 新 的 转移 规则 系统 来 阐述 语 
义 的 主要 部 分 。 规 则 集 包括 指导 智能 体 正 常 操 作 的 操作 规则 和 针对 失败 和 环境 发 
生 不 可 预见 的 变化 作出 反应 的 修复 规则 。 对 于 任务 分 配 问 题 的 求解 ， 介 绍 了 一 种 
递归 式 分 配 算法 ， 即 在 规划 层次 的 每 一 层 中 对 智能 体 分 配 任务 。 根 据 局 部 性 原则 
和 自治 性 原则 ， 针 对 所 参与 的 规划 ， 每 个 智能 体 对 分 配 进行 局 部 计算 。 该 方法 要 
求 对 于 给 定 的 ALICA 程序 ， 必 须 对 智能 体 完 成 计算 分 配 的 一 个 合理 特性 。 根 据 
规划 之 间 的 耦合 程度 ， 区 分 并 讨论 了 两 种 不 同 需求 。 最 后 ， 表 明 如 果 根 据 第 4 章 
所 述 程序 是 结构 良好 的 ， 则 每 个 智能 体 的 内 部 状态 都 会 构成 一 个 树 ， 并 满足 必要 
的 一 致 性 公理 。 为 提高 效率 ， 可 通过 具体 实现 来 利用 该 特性 。 
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在 ALICA 中 ， 团 队 合作 的 冲突 主要 体现 在 任务 分 配 的 冲突 上 。 对 于 参与 的 
每 个 规划 ， 每 个 智能 体 都 具有 一 组 表示 对 该 规划 中 的 任务 分 配 智能 体 的 信念 。 
如 5.8 节 所 述 ， 分 配 冲突 可 能 是 由 于 团队 中 的 信任 基 不 同 、 执 行规 划 不 合理 或 执 
行 不 允许 闲置 的 不 完全 规划 ( 即 强制 执行 完全 分 配 ) 而 造成 的 。 

在 参考 文献 [158] 中 ， 讨 论 了 一 种 不 依赖 域 相 关 信 息 来 检测 和 消解 这 种 冲 
突 的 方法 ， 本 章 主 要 是 基于 上 述 研究 成 果 。 回 顾 定义 5. 18 和 定义 5. 19， 将 任务 
分 配 看 作 一 个 h(a,p， +，z) 形式 的 信念 集 。 通 过 一 种 任务 分 配 算法 ， 对 规划 
类 型 或 层次 化 规划 类 型 进行 任务 分 配 计算 ， 之 后 根据 所 接收 的 信息 来 更 新 相应 的 
信念 。 由 于 ALICA 智能 体 定 期 广播 其 规划 基 ， 因 此 根据 远 端 计算 的 部 分 结果 来 
更 新 本 地 计算 的 任务 分 配 。 男 一 种 方法 是 直接 根据 行为 识别 来 进行 更 新 ， 这 样 如 
果 本 地 智能 体 可 观测 到 其 他 智能 体 的 动作 ， 则 可 推理 其 在 规划 树 中 的 状态 。 
在 此 ， 将 这 种 识别 任务 看 作 一 种 环境 通信 。 


6.1 冲突 检测 


由 于 是 对 于 一 个 规划 或 规划 类 型 产生 冲突 ， 因 此 接 下 来 仅 针 对 一 个 特定 的 规 
划 类 型 P 进行 分 配 ， 这 是 限于 In(a, p, T, z) 形式 的 信念 基 子 集 ， 其 中 PEP。 


另外 ， 由 于 在 随后 的 冲突 检测 机 制 中 状态 并 不 重要 ， 在 此 引入 宏 In(a,p,7) = 
( 4z)In(a,p,7,z). 

定义 6.1 (冲突 ) 两 个 分 配 C, 和 GRENZ, 4 ELS eR Et Tal — 
规划 类 型 P， 并 且 对 于 某 一 智能 体 <， 不 满足 CH In(a, p, 7) OC, In(a, p, 
7) 。 对 于 规划 类 型 P， 两 个 智能 体 和 四 发 生 冲 突 ， 当 上 且 仅 当 两 个 智能 体 均 信 
任 冲 突 分 配 。 在 此 , 将 In(a, p, +) 称 为 冲突 的 一 个 成 因 。 值 得 注意 的 是 ， 产 
生 冲 突 可 能 会 有 多 种 成 因 。 

命题 14 ”如 果 对 于 规划 类 型 P， 由 In(a, p, 7) 造成 两 个 智能 体 w 和 a 发 
生 冲 突 ， 那 么 wj 或 内 和 智能 体 之 间 必 有 冲突 。 

证 明 : 设 对 于 规划 类 型 P， 两 个 智能 体 a, 和 a, 发 生 冲 突 。 不 失 一 般 性 ， 进 
一 步 假设 智能 体 a 信任 P 的 一 个 任务 分 配 ， 其 中 包含 冲突 成 因 的 某 个 状态 z 下 的 
In(a,p，7，z)。 则 对 于 智能 体 a 信任 的 P 中 的 任务 分 配 C, ， 必 然 满 足 : 
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o b RAWAM, BIC Vp',7’,2")In(B,p’,7',2") € Cy; 

e b 分 配给 p PH—MES 7’, BMC dr’,z’)In(b,7’,p,z’) eC, NATET; 

o 4 分 配给 p 中 另 一 个 规划 已 ， 即 ( Ap! vr',2')In(b,p' Tz) Ap#p'。 

根据 规划 基 的 一 致 性 〈 定 理 5.2), b 不 能 分 配给 同一 规划 中 的 两 个 任务 或 
同一 规划 类 型 中 的 两 个 规划 ， 因 此 无 法 保持 不 与 ,冲突 的 信念 In(b,p，7，z)。 
由 于 不 能 保持 与 a 冲突 的 m(5，p，r，z) ， 因 而 该 命题 成 立 。 如 果 5 为 a 或 &， 
该 命题 也 同样 成 立 。 

该 特性 可 保证 在 团队 中 分 散 分 配 的 智能 体 至 少 会 与 一 个 智能 体 产生 冲突 ， 由 
此 具有 冲突 检测 的 机 会 。 

为 设计 一 种 检测 机 制 ， 需 要 观察 任务 分 配 是 如 何 随时 间 变 化 的 。 对 于 规划 类 
型 p， 一 个 智能 体 的 分 配 会 根据 下 列 情况 发 生变 化 : 

o 重新 分 配 : 智能 体 采用 一 个 新 的 分 配 来 提高 效用 。 

© 消息 : 智能 体 接收 一 个 有 关 p 中 其 他 智能 体 状态 的 消息 。 

© 放弃 : 智能 体 中 止 规划 ， 由 此 不 再 执行 分 配 。 

© 删除 : 某 些 时 候 ， 智 能 体 没有 接收 到 来 自 其 他 智能 体 的 消息 。 这 种 情况 
下 ， 从 团队 中 去 除 该 智能 体 ， 即 不 再 有 任务 分 配 。 

删除 是 考虑 到 智能 体 损坏 并 失去 通信 能 力 而 采取 的 。 由 于 删除 事件 可 看 作 消 
息 事 件 的 一 种 特殊 情况 ( 即 一 个 空 规划 基 消 息 ) ， 在 此 将 不 作 考 虑 。 同 样 ， 也 不 
再 考虑 智能 体 放弃 规划 的 事件 ， 因 为 该 事件 会 终止 本 地 智能 体 执行 规划 ， 通 过 消 
息 事 件 这 对 于 其 他 智能 体 是 可 见 的 。 通 过 智能 体 不 断 重复 参与 或 放弃 一 个 规划 ， 
可 检测 由 此 产生 的 冲突 。 持 续 冲 突 ( 即 持续 较 长 时 间 的 冲突 ) 会 导致 在 智能 体 
所 信任 的 分 配 中 产生 一 个 时 空格 局 时 间 模 式 ， 因 此 在 此 正式 定义 分 配 是 如 何 随时 
间 变 化 的 。 

定义 6.2 (分 配 事件 ) ”一 个 分 配 事 件 。 是 一 个 由 分 配 加 + I) He LO 
组 成 的 二 元 组 (3+ ，8- ) ， 两 者 都 是 形式 In(a, p, 7) 的 基础 集合 ， 使 得 
oND- =P WR AP) (Vp)In(a,p,7) e+UD-_rpeP， 即 所 有 分 配 事件 
都 仅 包含 对 单个 规划 类 型 的 加 和 减 。 

利用 二 元 仿 。 来 表示 分 配 事件 的 组 合 ， 即 e。 。e =e;。 

定义 6.3 (分 配 事件 组 合 ) e= (937) 和 es= (OF, 0) 为 两 
个 任务 分 配 事件 ， 则 其 组 合 可 定义 为 

ece, =( (9f -O7 )U(O -0r ), (Br -87 ) UCO -87 )) 

该 组 合 允 许 对 所 采用 分 配 中 多 个 事件 的 结果 进行 独立 推理 。 在 事件 组 合 下 ， 
分 配 事件 构成 一 个 可 交换 群 。 

如 果 一 个 智能 体 a 从 另 一 个 智能 体 6 接收 到 一 个 规划 消息 ， 这 会 产生 一 个 针 
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对 智能 体 a 正在 执行 的 每 个 规划 类 型 的 分 配 事件 。 其 中 有 四 种 不 同情 况 : 

@ 对 于 分 配 ， 智 能 体 a Fb 达成 一 致 ， 因 此 分 配 事件 为 空 ， 可 忽略 。 

© a 不 信任 b 所 参与 的 规划 类 型 ， 而 b 信任 ， 这 对 于 某 些 p 和 7 将 产生 分 配 
事件 ({In(b, p, 7)}, $)。 

@ a 认为 5 所 执行 的 任务 或 规划 与 5 实际 执行 的 规划 或 任务 不 同 ， 由 此 产生 
事件 ({In(b6, p, 7)}，{In(b, p’, 7')}), 使 得 pp'V7rz7'。 

@ a 误 认为 8 参与 了 该 规划 类 型 ， 则 对 于 某 些 p 和 7 会 产生 分 配 事 
件 (@,，{In(b, p, 7) })o 

根据 命题 14 ， 这 些 是 所 需 考 虑 的 情况 。 如 果 对 a 进行 重 分 配 ， 且 两 个 事件 
的 组 合 中 不 含有 关于 的 情况 ， 则 会 产生 一 个 循环 。 

定义 6.4 (分 配 循环 ) ” 设 e, 为 一 个 由 于 从 智能 体 b 发 送 给 智能 体 a 的 规划 消 
息 的 非 空 分 配 事 件 ， 并 设 ,为 a 接收 该 消息 后 的 下 一 个 分 配 事件 。 如 果 en oe, = 
(A,B), 使 得 ( Vp,7)In(b,p,7) ¢ (4UB)， 则 会 产生 一 个 循环 。 

因此 ， 如 果 智能 体 根据 重新 分 配 的 消息 可 恢复 分 配 ， 则 发 生 一 次 循环 。 智 能 
体 可 很 容易 地 通过 监视 分 配 事件 来 检测 循环 。 当 然 循环 并 不 意味 着 会 有 冲突 ， 也 
可 能 循环 只 是 反映 了 一 个 快速 变化 情况 。 然 而 如 果 连 续 发 生 多 次 循环 ， 则 将 不 像 
是 对 情况 变化 的 正常 反应 。 循 环 周期 长 度 取决 于 智能 体 通信 和 思考 的 频率 。 在 机 
器 人 足球 比赛 中 ， 通 常平 均 通信 频率 为 10Hz， 而 思考 周期 频率 为 30Hz， 这 样 两 
次 连续 循环 的 持续 时 间 平 均 为 117ms。 在 这 段 时 间 内 ， 要 求 团队 来 回 改 变 两 次 分 
配 的 情况 是 不 大 可 能 的 。 因 此 可 限制 连续 循环 的 次 数 小 于 2， 否 则 若 超过 两 次 ， 
则 智能 体 有 信心 来 假设 产生 冲突 。 只 要 相对 于 动态 环境 ， 通 信 频 率 和 思考 频率 较 
高 ， 且 接收 到 发 送 消息 的 概率 不 为 0， 就 可 设置 一 个 合理 的 限制 。 

接 下 来 ， 将 循环 周期 检测 集成 到 pALICA 的 操作 语义 中 。 记 A(P,，B,， 8B,) 
来 表示 规划 类 型 P 中 两 个 信任 基 B 和 B, 之 间 的 分 配 不 同 : 


A(P,B, Bs) = {In(e pr) |pePA(3z)In(a,p,T,z) B, AIn(a,p,7,z) eB,}, 
{In(a,p,T)|pePA(3z)In(a,p,T,z) ¢B, AIn(a,p,7,z) EBD) 
为 检测 循环 周期 ， 智 能 体 必须 记录 部 分 分 配 历史 。 假 设 在 信任 基 中 具有 两 
个 谓词 : Cycles(P, i) 表示 规划 类 型 P 执行 过 程 中 发 生 的 第 i 次 循环 ， 
ADif(P，d) 表示 在 规划 类 型 已 中 记录 的 当前 分 配 不 同 d。 
在 操作 规则 的 形式 中 进行 必要 更 新 ， 以 扩展 5. 13 节 中 定义 的 原始 操作 语义 。 
写 出 : 
Gonf(a)—Conf(a)’ 
“(B,Y,E,R)—(B',Y',E’,R') 
表示 如 果 规 则 7 将 配置 Conf(a) 映射 到 Conf(a)', WHUN (B, Y, E, R) 
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映射 到 (B', Y’, BE’, R')。 

首先 ， 只 要 一 个 智能 体 通 过 接收 消息 或 行为 识别 获悉 有 关 其 他 智能 体 状 态 的 
新 信息 ， 规 则 Sense 就 将 该 信息 集成 到 信任 基 中 。 规 则 Sense 则 是 对 此 进行 扩 
展 ， 来 更 新 由 AD 表示 的 历史 信息 : 

ass (B,Y,E,R) = (B',Y',E',R') 
“F (B,Y,E,R)—>((B'-8-)+68+,Y',E',R') 
式 中 V- = {ADiff(P,d) |(p,7,z) eT ApeP}; 
V+ = { ADiff(P,d A(P,B,B') ) |ADiff(P,d) ed }, 

其 次 ， 每 当 一 个 智能 体 通过 应 用 规则 Adapt 来 动态 重 分 配 规 划 中 的 智能 体 
时 ， 同 时 也 更 新 分 配 差 异 。 另 外 ， 一 个 非 空 的 重 分 配 会 产生 一 个 空 差异 ， 这 时 会 
检测 到 一 次 循环 。 该 过 程 可 由 规则 Adapt 反 映 : 


Adapt 
(B,Y,E,R) > (B',Y’,E',R') 
Adapta TE TE, R)>((B'-0-) +0* ,1’,B’R’) 


式 中 A` =1ADif(P,d) |(p,r,z) srApePli 
A* = | ADiff(P,d-A(P,B,B') ) |ADiff(P,d) eA |; 
B- ={Cycles( P,i) |Cycles(P,i) e BA ADiff(P,(7+,r-)) eA A(r+# 
@®\ r- #@) \ADiff(P,(®,@)) cA*}; 
B* ={Cycles( P,j) |Cycles(P,i) eB” Aj=it+1}; 
C` ={Cycles(P,i) |Cycles(P,i) e B \Cycles(P,i) ¢B AA(P,B,B') ¥(@,®@)}; 


C* ={Cycles(P,0) |Cycles(P,i) e C7}; 
v+ =A‘ UB UC’; 
D= =A” UB UC a 
也 就 是 说 ， 只 要 执行 重 分 配 ， 就 要 更 新 相应 的 分 配 差 异 。 每 次 更 新 都 会 产生 
个 空 的 分 配 差异 同时 增加 相应 的 循环 次 数 。 如 果 一 个 重 分 配 产生 一 个 非 空 差 
异 ， 则 循环 次 数 复位 为 0， 这 是 由 于 在 此 情况 下 循环 序列 结束 ， 且 由 于 环境 的 动 
态 性 可 能 会 自 适 应 。 
最 后 ， 每 当 一 个 智能 体 放弃 执行 规划 类 型 ， 就 应 复位 分 配 差异 和 循环 的 相关 
信息 。 这 样 只 要 由 pALICA 表示 的 规则 原始 集合 中 的 规则 7 终止 执行 规划 类 型 ， 
一 条 规则 Reset,, 就 会 复位 相应 信息 : 
(BY E R) > (B',Y",E',R') 
Y,E,R)—((B’-0-) +8" ,Y',E’,R’) 
式 中 V- =| Cycles(p,i) , ADiff(p,d) |PePvA_,( dp) (p,7,z) er’ ApeP}; 
V+ = | Cycles(p,0) , ADiff(p,(®@,B))|PePvA—( Ap) (p,7,z) er’ 


ApeP}. 


Reset,, : (B 
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6.2 冲突 消解 


在 给 定 上 节 讨 论 的 检测 机 制 条 件 下 ， 可 制定 一 个 对 观测 到 的 冲突 的 反应 。 一 
且 一 个 智能 体检 测 到 次 连续 循环 ， 则 可 假设 存在 一 个 冲突 。 为 避免 冲突 ， 将 冲 
突 的 规划 类 型 任务 分 配 过 程 切 换 到 一 个 集中 协调 机 制 。 这 种 局 部 领导 者 的 概念 类 
似 于 STEAM 中 的 团队 领导 者 ” ， 然 而 在 此 只 是 在 发 生 冲 突 的 情况 下 采用 一 种 
基于 领导 者 的 决策 方法 ， 而 不 是 作为 一 种 默认 的 处 理 机 制 。 

最 简单 的 领导 者 选举 方法 之 一 是 尾 强 凌 弱 (bullying) 法 。 如 果 自 认为 是 
一 个 领导 者 时 ， 该 方法 需要 节点 来 广播 选举 消息 。 一 个 所 有 可 能 参与 节点 范围 内 
的 总 排序 决定 了 哪个 主动 节点 可 成 为 领导 者 。 因 此 ， 每 当 一 个 节点 从 一 个 优先 级 
更 低 的 节点 处 接收 到 消息 ， 就 开始 广播 ， 如 果 从 一 个 优先 级 更 高 的 节点 处 接收 到 
消息 ， 则 停止 广播 。 值 得 注意 的 是 ， 在 不 可 靠 的 异步 通信 情况 下 ， 不 能 保证 只 
一 个 节点 认为 是 领导 者 。 然 而 在 此 可 假设 消息 可 能 正确 接收 也 可 能 压根 没有 接 
收 ， 即 在 经 过 通信 信道 后 消息 没有 失真 ， 以 及 并 不 是 所 有 消息 都 丢失 。 由 于 可 利 
用 一 个 合适 的 误差 检测 程序 来 识别 并 丢弃 失真 的 消息 ， 因 此 可 认为 这 些 假设 都 是 
合理 的 。 根 据 这 些 假 设 ， 一 个 连续 的 情 强 凌 弱 算法 可 保证 只 有 一 个 节点 最 终 会 成 
为 该 群 中 唯一 的 领导 者 ， 该 算法 中 自 认 为 是 领导 者 的 节点 不 会 停止 广播 。 

在 上 述 情况 中 ， 领 导 者 会 定期 广播 关于 规划 类 型 的 一 个 分 配 。 因 此 可 将 选举 
言 息 与 实际 情况 相 结合 ， 从 而 减少 通信 开销 。 在 后 面 的 内 容 中 ， 将 这 种 组 合 消息 
称 为 权威 消息 ， 这 时 所 产生 的 通信 协议 允许 智能 体 对 所 接收 的 权威 消息 进行 快 
速 、 及 时 的 反应 。 一 旦 接收 到 权威 消息 ， 智 能 体会 有 三 种 操作 : 首先， 如 果 没 有 
从 优先 级 较 高 的 智能 体 处 接收 到 权威 消息 ， 则 该 智能 体 开始 广播 自身 的 权威 消 
息 ; 其 次 ， 在 权威 消息 在 所 接收 的 消息 中 优先 级 最 高 的 情况 下 ， 将 采用 该 权威 消 
息 所 包含 的 分 配 ; 第 三 ， 如 果 智 能 体 已 知 一 个 具有 更 高 优先 级 的 领导 者 ， 则 忽略 
该 消息 。 

当 团 队 分 配 由 领导 者 决定 时 ， 会 比 正常 的 分 布 式 决 策 状态 下 的 反应 能 力 较 
低 。 这 是 由 于 领导 者 需要 发 送 其 他 额外 消息 以 及 领导 者 应 被 告知 其 无 法 观测 的 变 
化 情况 ， 因 此 团队 应 尽量 切换 到 更 动态 的 模式 。 另 一 方面 ， 如 果 团 队 模式 切换 回 
去 得 太 快 ， 冲 突 源 〈 如 信念 基 不 一 致 ) 仍 存在 ， 导 致 还 会 再 次 发 生 冲 突 。 因 此 
对 规划 类 型 而 言 ， 团 队 处 于 权威 状态 的 时 间 间 隔 应 能 动态 自 适应 。 

一 个 相应 算法 见 表 6. 1。 对 于 每 个 规划 类 型 ， 每 个 智能 体 都 保持 在 合作 模式 
Mode(P) ， 并 且 利 用 一 个 时 变 间隔 AuthTime( P) 来 表示 团队 处 于 权威 模式 的 时 
间 。 该 时 间 范 围 为 tu 到 ts， 这 取决 于 冲突 检测 的 频率 。 可 任意 选择 智能 体 之 间 
的 优先 权 ， 但 必须 符合 团队 的 共同 知识 。 在 情 强 凌 弱 算法 中 通常 从 一 个 全 序 集合 
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中 选择 一 个 唯一 的 标识 符 。 

将 该 算法 集成 到 操作 语义 中 非常 简单 。 首 先 ， 对 于 冲突 消解 ， 需 要 额外 的 信 
念 来 反映 每 个 规划 类 型 的 状态 ， 因 此 在 信任 基 中 增加 下 列 谓词 : 

e Mode(P, x) 表示 规划 类 型 P 正 在 模式 x 下 执行 。 

。AuthTime( 已 ，:) 表示 对 于 规划 类 型 P， 当 前 的 权威 时 间 为 +。 


表 6.1 冲突 消解 算法 


foreach(plantype P in execution) do { 
if (Mode(P) = normal) { 

if ( conflict detected or incoming authority message with lower precedence) { 
Mode(P) := authority : 
tbegin := NOW; 
AuthTime(P) := min(tmax-AuthTime(P) +77 ); 

} 

if (incoming authority message with higher precedence) 
Mode(P) := commanded; 

else { 
perform reallocation if needed; 
AuthTime(P) := max(tmin.AuthTime(P)+1~ ): 

} 

} 
else if (Mode(P)= authority) { 

perform reallocation if needed: 

broadcast authority message: 

if (AuthTime(P) < tbegin) Mode(P)) := normal: 

if (incoming authority message with higher precedence) Mode(P) := commanded: 

} 
else { 

adopt allocation of last received message with highest precedence: 

if (time since last authority message > timeou) 
Mode(P) := normal; 


另外 ， 将 下 列 公 理 包含 在 3, 中 : 
( V Pe PlanTypes* (z))( 了 x) Mode(P, x) 
( V Pe PlanTypes* (z0))( dt) AuthTime(P, t) At >0 
Mode(P, x) \ Mode(P, y)—x =y 
AuthTime(P, t) A AuthTime(P, s)—>t =s 
Mode( P, x)—x = normal V x = commanded V x = authority 
前 两 个 谓词 是 第 二 个 参数 的 功能 ， 对 于 每 个 规划 类 型 ， 在 信念 基 中 该 谓词 只 
有 一 个 正 值 。 另 外 允许 执行 的 横 式 有 正常 模式 、 命 令 模 式 和 权威 模式 ， 这 分 别 表 
示 各 自 的 规划 类 型 是 正常 执行 ， 或 在 另 一 个 智能 体 的 控制 下 执行 ， 或 作为 领导 者 
TAT. 
接 下 来 ， 对 所 讨论 的 规则 集 进行 扩展 以 包括 冲突 消解 。 最 重要 的 是 ， 修 改 
Adapt 规则 ， 使 之 只 能 用 于 不 在 命令 模式 下 执行 的 规划 类 型 ， 即 动态 重 分 配 只 能 
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工作 于 正常 模式 或 权威 模式 下 的 领导 者 : 

Mode( P ‚x ) A x # commanded A (B Y E R) > (B' Y’ E'R’) 
(B,Y,E,R)—((B' - AuthTime( P ,t)) + AuthTime(P,t,),Y',E',R') 
式 中 PP 一 一 进行 重 分 配 的 规划 类 型 ; 

t, =max(t,;,, ET Jo 

BERT MY BY ATE EINK BGA FN ITT EL n, IA EAR LA AE 
在 这 种 情况 下 ， 应 切换 到 权威 模式 ， 增 大 权威 时 间 ， 并 重 置 循环 次 数 。Auth., 规 
则 反映 了 该 行为 : 
(ps,7,2) eTApePAMode(P,normal) A AuthTime(P,t) Ad 
i (B,Y,E,R)—((B-8-)+0+,Y,E,R) 
式 中 =Cycles(P, x) Axæn, nfe—P TERA, ZANTE 6.4 发 生 的 
n 次 连续 循环 ; 

V- ={Mode(P, normal), Cycles(P, x), AuthTime(P, 1)}; 

B+ ={Mode(P, authority), Cycles(P, 0), AuthTime(P, min (tax, t*1'))}, 

根据 权威 消息 进行 冲突 消解 的 核心 是 Cmd,. 规 则 ， 即 对 接收 到 的 权威 消息 作 
出 反应 。 消 息 接收 事件 可 由 AuthMsg(a’, P, C) 表示 ， 其 中 a' 为 发 送 消息 的 管 
能 体 ，P 为 规划 类 型 ，C 为 a 执行 的 任务 分 配 。 如 果 接 收 消息 的 智能 体 认为 发 送 
消息 的 智能 体 具有 更 高 的 优先 权 (a <a')， 并且 也 参与 执行 规划 类 型 P， 则 假设 
将 任务 分 配 发 送 ， 如 果 该 智能 体 由 此 进入 一 个 新 的 状态 ， 则 会 针对 新 进入 的 状态 
设计 一 个 任务 分 配 。 


C 


Adapt: 


Auth, 


oF AuthMsg(a',P,C) Aa <a' \In(a,p,7,z) ApeP 
"(BY ,E,R)->((B-08; ) +07 +9, (Y -0; ) Ud; ,(E-0; ),R) 
式 中 a 一 一 本 地 智能 体 ; 
V; = {Mode(P,x) ,Cycles(P,c) }U{In(a"’,p’,r',2") lp’ eP}; 
ý = {Mode( P , commanded ) ,Cycles( 忆 ,0) }UC; 
{Alloc(z’)} In(a,p',T',z') eC Azz’ 
i -lo 其 他 ; 


o fiCp,T,z)} U{(p',T"",z") lp © Plans* (z)| Alloe(2’) eð 
sla 其 他 ; 

or = i (PT ,z')lIn(a,p',T',z') eC}; 

o> = { (b521) 1 (pay rza) ed: Ab e Behaviours(z,) | o 

另 一 方面 ， 如 果 接 收 消息 的 智能 体 认 为 自身 具有 更 高 优先 权 ， 则 将 切换 到 权 
威 模式 ， 并 根据 尾 强 凌 弱 算法 协议 开始 广播 任务 分 配 : 
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Taskåuth_: AuthMsg(a',P,C) Aa >a' Aln(a,p,7,z) Ap eP A Mode( P,, normal ) 
me (B,Y,E,R)—((B-0,; ) + Mode(P, authority) ,7°,E,R) 
式 中 #8- =Mode(P, normal) 。 

当 达 到 权威 消息 的 时 间 阔 值 ， 领 导 者 将 切换 回 正常 模式 ， 并 停止 广播 。 即 便 
没有 要 求 ， 也 会 由 一 个 额外 消息 通知 全 体 团 队 成 员 ， 由 此 可 加 速 其 余 队 员 的 模式 
切换 。 和 否则 命令 智能 体 将 记录 缺少 权威 消息 ， 并 根据 DropCmd。, 规 则 经 一 段 延 时 
后 切换 回 正 常 模式 。 该 时 间 延 迟 是 非常 必要 的 ， 因 为 领导 者 智能 体 随 时 可 能 损坏 
而 导致 整个 团队 没有 领导 者 。 

DR 
式 中 9; = Mode(P，authority) ， 且 如 果 对 于 规划 类 型 P， 切 换 到 权威 模式 的 时 
间 大 于 1， 则 满足 OCP, t). 
和 Mode( P, commanded) A@'(P, timeo) 
“ (B, Y, E, R) — ((B-0,) +Mode(P, normal), Y, E, R) 
式 中 9, =Mode(P, commanded), ， 且 如 果 接 收 到 最 后 权威 消息 的 时 间 大 于 
timeout » 则 满足 $'(P, Pam) 4 

limeou 一 一 常数 ， 与 通信 频率 和 期 望 丢 包 率 有 关 的 参数 。 

最 后 ， 只 要 本 地 智能 体 放 弃 执 行规 划 类 型 ， 就 需要 重 置 Mode(P,，x) 所 表 
示 的 信息 。 这 可 由 Reset, ,规则 表示 : 


ei (B, Y, E, R) "S" (B', Y', E', R') 
“* (B, Y, E, R) > ( (B’-8-) +8+, Y', E', R') 
式 中 #8- = {Mode(P,x)1(p,7,z) eX ApePN™ (p'ePA(p',T',z')eY')}; 

V+ = {Mode( P normal) |Mode(p,x) ev- }. 

上 述 规则 集 通 过 对 某 个 节点 〈 即 规划 树 中 的 规划 类 型 ) 选举 一 个 负责 任务 
分 配 的 领导 者 ， 使 得 团队 对 冲突 具有 动态 反应 和 自 适 应 性 。 最 重要 的 是 ， 领 导 者 
的 选举 只 是 针对 规划 树 中 的 某 一 特定 节点 ， 因 此 规划 树 中 的 其 余 节 点 不 会 受 冲突 
消解 的 影响 ， 而 继续 以 正常 动态 方式 进行 。 当 然 也 可 采用 其 他 机 制 ， 例 如 多 数 票 
表决 法 。 这 些 机 制 都 可 以 类 似 的 形式 集成 到 ALICA 中 。 

显而易见 ， 这 种 冲突 检测 和 消解 的 机 制 满足 5. 14 节 中 所 讨论 的 特性 。 

命题 15 ”规则 扩展 符合 规划 基 公 理 卫 , ， 并 与 规划 基 的 树 形 结构 保持 一 致 。 

证 明 : 修改 规划 基 的 唯一 新 规则 是 Cmd,,。 由 于 唯一 的 有 效 分 配 是 由 领导 者 
提供 ， 因 此 该 规则 采用 该 有 效 分 配 。 如 果 领 导 者 不 能 提供 一 个 有 效 分 配 ， 则 放弃 
相应 规划 。 在 本 地 智能 体 是 由 领导 者 重 分 配 的 情况 下 ，Cmd,, 会 从 规划 基 中 去 除 
当前 分 支 。 此 时 在 规划 基 中 最 多 增加 一 个 元 组 ， 并 在 新 进入 的 状态 下 进行 递归 分 
配 。 该 元 组 是 针对 规划 类 型 P 中 的 一 个 规划 。 由 于 与 规划 类 型 P 中 某 一 规划 相 
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关 的 所 有 元 组 已 去 除 ， 因 此 该 命题 成 立 。 

命题 16 ”规则 扩展 不 会 产生 任何 孤立 行为 。 

证 明 : 没有 一 个 新 增 规则 会 对 执行 集 增加 一 个 行为 。 唯 一 会 修改 规划 基 的 规 
则 是 Cmd。 ， 如 果 该 规则 从 规划 基 中 去 除 相应 的 三 元 组 (p, r, 2), WAART 
集中 去 除 所 有 元 组 (b, z) 

命题 17 ”规则 扩展 满足 命题 10。 

证 明 : 会 修改 规划 基 或 形式 m(a，P，r，z) 中 的 信念 的 唯一 规则 是 Cmd., 
该 规则 以 相同 方式 来 更 新 规划 基 或 信念 。 

在 10. 2 节 中 将 介绍 一 种 对 该 冲突 消解 技术 的 经 验 评估 方法 。 值 得 注意 的 是 ， 
不 可 能 用 这 种 方法 解决 所 有 冲突 。 由 于 不 合理 规划 或 由 于 不 允许 智能 体 空闲 而 不 
能 有 效 执行 规划 所 导致 的 冲突 不 能 用 该 方法 解决 。 利 用 权威 消息 解决 该 问题 的 广 
法 要 求 领导 者 智能 体 应 考虑 其 未 参与 的 子规 划 。 只 要 选举 出 一 个 领导 者 ， 就 可 通 
过 切换 到 全 局 任务 分 配 来 实现 。 在 这 种 情况 下 ， 以 冲突 的 规划 类 型 为 根 节点 ， 领 
导 者 可 对 所 有 参与 智能 体 计算 递归 式 任务 分 配 。 然 而 如 5.9 节 中 所 述 ， 领 导 者 可 
能 缺乏 足够 信息 来 完成 任务 分 配 。 另 一 种 方法 是 由 在 底层 规划 需求 中 产生 冲突 的 
团队 成 员 来 向 领导 者 提供 信息 。 只 要 智能 体 不 符合 权威 消息 ， 就 可 广播 其 无 法 执 
行 任务 的 信息 ， 随 后 领导 者 将 会 考虑 该 信息 。 然 而 由 于 为 了 得 到 一 个 合适 的 分 
配 ， 需 要 交换 可 能 存在 的 多 个 消息 ， 因 此 该 方法 可 能 会 由 于 环境 的 动态 变化 而 产 
生 一 个 过 时 的 分 配 。 在 今后 的 工作 中 ， 将 深入 研究 该 问题 。 理 想 情况 下 ， 由 于 冲 
突 消解 会 在 一 定 程度 上 降低 性 能 ， 因 此 这 种 冲突 是 可 以 完全 避免 的 。 实 际 上 ， 规 
划 的 合理 性 应 在 一 个 预 运行 的 有 效 步 又 中 验证 或 由 分 配 产生 过 程 来 保证 ， 如 通过 
所 采用 的 规划 算法 。 表 6. 2 总 结 了 本 章 所 介绍 的 信念 和 规则 ， 通 过 分 配 循环 来 检 
测 冲突 以 及 一 个 局 部 领导 者 来 进行 冲突 消解。 

表 6.2 用 于 表示 冲突 检测 和 冲突 消解 的 信念 和 规则 


Ery 
Aw 


=> 


& 


sree 用 于 区 别 每 个 规划 类 型 的 当前 规划 差异 。 如 果 由 于 采用 Adapt 规则 而 使 得 
? 差异 为 空 ， 则 产生 一 次 循环 
Cycles(P, i) 表示 在 规划 类 型 P 的 执行 过 程 中 ， 检 测 到 多 少 次 分 配 循环 
Mode(P, x) x 为 规划 类 型 P 的 执行 模式 。 这 些 模式 可 以 是 正常 模式 、 权 威 模式 或 命令 模式 
pene 0 该 谓词 反映 了 对 每 个 规划 类 型 的 冲突 消解 的 动态 自 适应 持续 时 间 
规则 
Senseed 该 规则 是 对 Sense 规则 的 改进 ， 用 于 在 信念 基 中 记录 分 配 差异 
Adapta 该 规则 是 对 Adapt 规则 的 改进 ， 用 于 更 新 分 配 差异 和 循环 周期 次 数 
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( 续 ) 
规则 
Reseted 该 规则 对 不 再 执行 的 规划 类 型 的 相关 信息 进行 重 置 
Adapt 对 原始 规则 Adapt 进行 修改 以 使 得 命令 智能 体 不 会 自主 调整 任务 分 配 
Auth,, 只 要 一 个 智能 体检 测 到 足够 的 循环 周期 次 数 ， 就 会 切换 到 权威 模式 
只 要 接收 到 一 条 来 自 更 高 优先 级 智能 体 的 权威 消息 ， 就 会 将 本 地 智能 体 切换 
到 命令 模式 。 在 这 种 情况 下 ， 强 制 进 行 所 包含 的 任务 分 配 
Tekid FAP SSO oR BS 5 OL, BL BEE hc Bl) RR A ER R E AEE UR 
a 息 ， 就 会 切换 到 权威 模式 
DropAuth,, 用 于 一 旦 达到 AuthTime 表示 的 持续 时 间 ， 就 强制 领导 者 智能 体 切换 回 正常 模式 
DropCmd,, 表示 在 一 定时 间 内 没有 接收 到 权威 消息 ， 则 智能 体 从 命令 模式 返回 到 正常 模式 
Reset, 不 管 什么 原因 ， 都 将 重 置 智能 体 终止 执行 的 规划 类 型 的 模式 
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尽管 软件 架构 并 不 是 本 书 的 核心 内 容 ， 但 多 智能 体 协作 的 复杂 性 和 解决 方法 
的 多 样 性 值得 在 此 讨论 。 在 此 以 ALICA 的 参考 实现 作为 讨论 的 基础 。 该 参考 实 
现 可 在 BSD 协议 下 公开 获得 92 。 

ALICA 引擎 是 一 个 执行 ALICA 程序 的 软件 模块 。 该 引擎 与 规划 基 及 其 相关 
的 所 有 信念 、 触 发 行为 以 及 与 运行 ALICA 引擎 的 其 他 智能 体 之 间 的 通信 均 保 持 
一 致 ， 为 此 需要 以 某 种 机 器 可 读 的 形式 来 表示 ALICA 程序 。 这 可 由 7.1 节 中 介 
绍 的 建 模 工 具 链 来 提供 ， 之 后 在 7.2 节 中 讨论 了 ALCA 参考 引擎 的 内 部 设计 ， 
在 7.3 节 将 讨论 一 种 可 和 能 入 ALICA 的 整体 架构 的 模型 。 


7.1 建 模 工 具 与 交换 格式 


ALICA 参考 实现 具有 一 个 称 为 ALICA 规划 设计 器 的 图 形 化 开发 环境 ， 可 人 允 
许 创建 所 有 的 ALICA 语言 元 素 。2008 年 Scharf 开发 出 原始 实现 ， 之 后 进行 了 
不 断 发 展 。 

ALICA 的 实际 表示 形式 是 一 种 基于 XML 的 语言 ， 该 语言 可 作为 建 模 工具 、 
执行 引擎 和 模型 检验 器 之 间 的 一 种 交换 格式 。 这 种 表示 形式 是 一 种 利用 Eclipse 
建 模 框 架 (EMF) 59 实现 的 特定 域 语 言 (DSL) 。UML ”中 指定 的 EMF 模型 会 
产生 可 作为 编辑 器 和 引擎 之 间 交 换 格式 的 KMI 序列 化 。 

规划 设计 器 是 一 种 基于 Eclipse FR EG 的 图 形 化 工具 。 支 持 对 ALICA fE 
序 中 所 有 部 件 的 建 模 ， 即 角色 、 任 务 、 规 划 、 规 划 类 型 、 效 用 函数 和 条 件 以 及 在 
模型 中 以 一 种 模型 驱动 开发 形式 来 产生 代码 。 如 前 所 述 ， 建 模 规 划 是 以 XML 格 
式 进 行 保存 ， 并 随后 由 运行 引擎 调用 。 然 而 从 效率 上 考虑 ， 该 工具 还 提供 了 一 种 
用 于 条 件 和 效用 评估 的 特定 平台 代码 生成 机 制 。 由 于 在 运行 期 间 会 频繁 地 进行 这 
些 评估 ， 因 此 生成 可 直接 执行 的 特定 平台 代码 具有 很 大 的 效率 优势 。 为 便于 直观 
理解 ， 图 形 化 表示 语言 元 素 。 


© http: //ros. org/ wiki/cn-alica-ros-pkg。 
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7.2 引擎 布局 


ALICA 的 参考 引擎 是 用 CHA ALLA, E mon Og FZ T. CASTE 
一 种 强 类 型 的 面向 对 象 的 命令 化 语言 ， 通 常 实时 编译 C# 程 序 S 并 采用 垃圾 收集 
器 8。 由 于 这 种 面向 对 象 的 命令 化 编程 方式 得 到 广泛 应 用 并 为 大 家 熟知 "5] ， 因 
此 在 此 采用 C# 语 言 来 作为 参考 实现 。 另 外 ， 与 C + + 语言 "9 相 比 ，C 术 看 言 也 更 
易于 阅读 和 理解 ， 同 时 仍 保留 了 高 效 性 '55] 。 最 后 ， 还 具有 其 他 语言 (如 Java) 
所 没有 的 一 些 特 性 ， 如 委托 、 有 限 运 算 符 重 载 、 数 值 类 型 的 泛 型 lambda 表达 
式 和 Properties (参见 参考 文献 [24] ) 。 

参考 引擎 意味 着 可 集成 到 特定 域 框架 中 ， 该 框架 是 由 信念 表示 框架 、 通 信 中 间 
件 、 感 知 器 和 执行 器 驱动 等 其 他 部 件 组 成 ， 由 此 可 编译 为 一 个 提供 广泛 的 API 的 库 。 

图 7.1 给 出 了 一 个 参考 实现 的 通用 布局 。 其 中 包括 5 个 核心 部 件 和 一 组 附加 模块 。 

引擎 接口 “引擎 接口 提供 了 启动 引擎 、 访 问 不 同 部 件 以 及 配置 运行 时 行为 所 
需 的 所 有 功能 。 

规划 基 ”规划 基 是 执行 一 个 ALICA 程序 的 核心 。 其 中 包含 程序 的 运行 时 表 
示 ， 即 规划 结构 中 智能 体 的 当前 状态 。 在 主流 程 中 ， 主 要 关注 后 续 访 问 规划 结构 
的 所 有 相关 部 件 和 模块 。 

规则 和 集 ” 规 则 集中 主要 包括 规划 基 定 期 调用 的 ALICA 操作 规则 ， 根 据 这 些 
规则 来 更 新 规划 结构 。 

任务 分 配 ”任务 分 配 包括 了 5.8 节 中 所 讨论 的 算法 。 如 果 需 要 的 话 ， 规 则 
集 将 应 用 这 些 任务 分 配 算法 来 更 新 规划 结构 。 

行为 池 ”该 部 件 用 于 管理 智能 体 所 具有 的 行为 集 。 根 据 行为 规范 ， 在 执行 集 
中 定期 或 事件 驱动 来 调用 当前 行为 。 同 时 还 提供 了 行为 的 所 有 必要 参数 。 

除了 上 述 的 必要 部 件 之 外 ， 引 擎 还 负责 管理 一 组 重要 的 可 扩展 且 可 替换 的 模块 。 

解析 器 ”在 给 定 XML 文档 以 及 利用 7.1 节 讨 论 的 建 模 工具 所 编译 的 库 的 条 
件 下 ， 该 模块 对 ALICA 程序 的 内 部 表示 进行 编译 。 尽 管 该 工作 非常 必要 ， 但 在 
内 存 中 用 其 他 方法 编写 程序 也 是 可 行 的 。 

同步 模块 ”根据 5. 13 节 中 所 定义 的 规则 进行 同步 传输 需要 增加 某 些 通信 来 
建立 共同 信念 ， 这 可 由 同步 模块 实现 。 

团队 观测 器 ”团队 观测 器 用 于 处 理 与 团队 成 员 的 所 有 定期 通信 ， 需 符合 程序 


www. mono-project. com, 
参见 Aycock!) 和 Arnold 4A D! 对 实时 编译 与 其 他 技术 综述 的 研究 工作 。 
参考 文献 [79] 中 深入 讨论 了 垃圾 收集 器 。 
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中 当前 状态 的 内 部 表示 ， 并 根据 所 接收 的 消息 进行 预测 。 


: | 解析 器 | | 司 步 模块 


团队 观测 器 | | 


See) Lee | | 
| 日 志 | 角色 分 配器 冲突 处 理 | 


oh i : 


图 7.1 ALICA 引擎 参考 架构 


角色 分 配器 ”根据 5.6 节 所 介绍 的 分 配 算法 ， 角 色 分 配器 为 智能 体 分 配角 色 。 
冲突 处 理 ”根据 第 6 章 内 容 ， 冲 突 处 理 模 块 检 测 并 消解 任务 分 配 中 的 冲突 。 
日 志 “日 志 模块 提供 了 一 种 简单 、 方 便 的 方式 来 在 文件 中 记录 规则 应 用 情况 。 


7.3 ”智能 体 软件 架构 


本 节 将 提出 一 种 基于 5.2 节 所 介绍 的 智能 体 模型 的 智能 体 架 构 。 该 架构 主要 
是 根据 Baer HEE, ， 以 及 参考 文献 [1] 中 所 提出 的 特定 域 架 构 CANOSA. 

图 7. 2 给 出 了 所 提 架 构 的 布局 。 直 接 来 自 于 感知 器 的 信息 由 一 个 或 多 个 外 部 
感知 部 件 进行 处 理 。 这 些 信息 可 用 于 执行 各 种 不 同 任务 ， 如 图 像 处 理 或 感知 信息 
融合 。 将 抽象 信息 发 送 给 环境 模型 。 环 境 模型 是 对 智能 体 信念 状态 的 内 部 处 理 表 
示 。 尽 管 在 某 些 情 况 下 ， 并 不 需要 一 定 要 满足 环境 的 内 部 表示 ， 但 在 大 多 数 实际 
场合 中 ， 环 境 以 及 所 需 执行 的 任务 都 很 复杂 。 因 此 ， 信 念 的 内 部 表示 非常 有 用 。 
在 此 并 不 限制 如 何 表示 信念 ， 实 际 上 ，ALICA 引擎 并 不 会 直接 访问 环境 模型 。 
因此 只 要 是 适用 于 域 的 表示 方法 都 可 使 用 ， 如 Bratman'” 的 基于 BDI 的 信念 模 
HY | FLUXUS! 采用 的 知识 表示 模型 、 基 于 本 体 的 模型 (参见 参考 文献 
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[25, 41]) 或 具有 最 新 感知 信息 的 普通 数据 结构 。 


智能 体 之 间 
的 通信 


Ca jH E 
rw 


图 7.2 智能 体 架构 


利用 一 个 共享 环境 模型 可 扩展 环境 模型 ， 即 集成 了 来 自 其 他 智能 体 的 信息 。 
共享 环境 模型 的 任务 主要 有 两 方面 ， 首 先是 估计 其 他 智能 体 的 知识 和 信念 ， 其 次 
是 融合 接收 信息 与 本 地 信息 来 获得 对 环境 统一 且 一 致 的 认识 。 针 对 该 问题 ， 
Reichle ”进行 了 详细 讨论 。 

如 上 所 述 ，ALICA 引擎 并 不 直接 访问 环境 模型 中 的 信息 ， 而 是 通过 两 个 特 
定 域 的 部 件 ， 即 表达 式 和 行为 。 表 达 式 部 件 包 含 了 规划 中 所 采用 的 所 有 公式 和 效 
用 函数 的 实现 。 如 7. 1 节 所 述 ， 这 并 不 是 ALICA 程序 基于 XML 的 表示 ， 而 是 独 
立 的 程序 段 ， 这 是 因为 保持 引 敬 和 信念 表示 之 间 的 松 耦 合 ， 可 能 会 提高 效率 。 有 
关 智 能 体内 部 状态 的 信念 ， 如 Inla, p, T, z) 和 Succeeded(a, p, T) 是 由 AL- 
ICA 引擎 内 部 管理 的 ， 可 提供 合适 的 接口 来 访问 这 些 信念 。 

行为 部 件 包括 ALICA 程序 中 所 有 特定 域 行为 ， 这 些 行为 由 引擎 内 的 行为 池 
控制 。 反 过 来 ， 每 个 行为 又 与 控制 部 件 外 部 的 行为 控制 器 通信 ， 然 后 这 些 控制 器 
又 与 机 器 人 硬件 或 软件 执行 器 通信 。 

这 种 在 主 程序 与 附加 传感器 或 执行 器 相关 部 件 之 间 的 严格 划分 可 易于 替换 后 者 。 
尤其 在 仿真 环境 是 开发 过 程 一 个 重要 部 分 的 机 器 人 领域 ， 可 交换 性 是 非常 重要 的 。 


7.4 实现 细节 


规划 基 在 内 部 表示 为 规则 集 通 过 遍历 可 应 用 规则 的 一 个 树 形 结构 。 规划 基 中 
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的 每 个 三 元 组 对 应 于 树 中 的 一 个 节点 ， 该 节点 包含 从 时 间 惟 到 权威 消息 的 各 种 其 
他 数据 结构 。 利 用 这 种 方式 ， 应 用 规则 所 需 的 所 有 必要 信息 都 可 本 地 获得 。 

所 有 语言 元 素 均 由 唯一 的 64 位 标识 符 识 别 ， 并 保存 在 哈 希 图 (hash maps) 
中 。 由 此 ， 为 指向 规划 、 任 务 或 状态 ， 智 能 体 只 需 与 这 些 标识 符 通信 ， 这 样 可 使 
得 序列 化 和 反 序 列 化 的 开销 最 少 。 

每 个 行为 都 通过 一 个 线程 来 确定 ， 即 在 执行 该 行为 之 前 都 保持 在 待机 状态 ， 
这 样 可 大 大 减少 个 体 行 为 的 启动 时 间 。 引 擎 内 的 所 有 线程 都 可 在 固定 的 时 间 间 隔 
内 相互 异步 运行 ， 或 对 引擎 接口 的 信号 作出 反应 。 由 此 ， 可 很 容易 地 通过 引擎 运 
行 时 的 行为 来 适应 某 个 域 的 具体 要 求 。 例 如 ， 设 置 成 功 信号 的 行为 Success (5b， 
z) 可 立刻 激活 规划 基线 程 ， 该 线程 反 过 来 又 依次 应 用 所 有 规则 ， 由 此 又 可 激活 
另 一 个 行为 。 由 于 异步 运行 线程 ， 因 此 可 消除 延迟 。 


7.5 通信 


通过 某 种 智能 体 间 的 通信 方法 ， 每 个 智能 体 在 团队 内 的 通信 通常 基于 一 个 中 
间 件 。ALICA 参考 实现 是 基于 Quigley 等 人 "提出 的 ROS 系统 (机 器 人 操作 系 
统 ) ， 其 中 基于 一 种 发 布 订阅 模式 提供 通信 机 制 。 然 而 由 于 ROS 采用 一 个 主 进程 
来 建立 和 管理 通信 通道 ， 因 此 目前 尚 不 能 应 用 于 多 机 器 人 场合 ， 这 正 是 因为 该 主 
进程 是 一 个 单 点 故障 。 为 解决 该 问题 ， 可 采用 其 他 中 间 件 系统 的 代理 ， 如 数据 分 
布 服务 (DDS) :5 。 在 机 器 人 足球 领域 ， 出 于 效率 的 考虑 ， 采 用 一 种 简单 的 UDP 
组 播 代理 。 
7.5.1 信息 交换 

pALICA 智能 体 之 间 的 信息 交换 可 分 为 两 大 类 : 有 关 环 境 的 特定 域 信息 和 
ALICA 内 部 消息 。 特 定 域 消息 通常 反映 了 发 送 智 能 体 的 全 部 或 部 分 信念 基 。 这 
部 分 的 通信 不 受 ALICA 的 控制 ， 假 设 是 通过 某 些 不 可 靠 的 通信 通道 进行 通信 。 

pALICA 定义 了 下 列 3 种 通信 方式 : 

© 包括 智能 体 的 规划 基 以 及 相关 的 成 功 信息 的 状态 广播 。 

o 建立 同步 传输 共同 信念 的 握手 协议 。 

© 包括 根据 第 6 章 对 特定 规划 冲突 消解 的 分 配 权 威 消息 。 

尽管 对 于 多 智能 体系 统 ，ALICA 是 一 种 域 无 关 的 编程 语言 ， 但 仍 主 要 应 用 
于 通常 是 无 线 通信 方式 的 移动 机 器 人 领域 。 因 此 采用 一 种 不 可 靠 的 广播 媒介 进行 
通信 ， 正 如 ALICA 中 的 消息 广播 机 制 。 在 此 假设 广播 通信 的 成 本 等 效 于 点 对 点 
通信 的 成 本 。 

状态 广播 是 以 一 个 动态 选择 频率 /,, 或 /,, 定 期 发 送 的 ， 发 送 频 率 取决 于 内 部 
状态 是 否 发 生变 化 。 状 态 信息 包括 智能 体 的 内 部 状态 〈 即 其 规划 基 ) ， 以 及 根据 
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定义 5.6 已 完成 的 和 认为 相关 的 任务 一 规划 二 元 组 。 由 于 智能 体 不 再 执行 相应 规 
划 ， 因 此 不 会 明确 发 送 失 败 消 息 。 然 而 为 以 示 区 别 ， 成 功 信息 必须 明确 发 送 。 如 
果 智 能 体 以 上 述 方式 接收 到 失败 消息 ， 则 可 以 尝试 补偿 缺失 的 智能 体 ， 或 中 止 执 
行 相 关 规 划 。 

这 些 状态 信息 的 大 小 取决 于 是 否 可 从 不 同 的 初始 状态 到 达 该 状态 ， 即 规划 中 
包含 的 状态 机 是 否 连 通 。 在 非 连通 情况 下， 状态 可 明确 地 识别 相应 的 任务 ， 这 可 
使 得 信息 大 小 减 半 ， 因 此 参考 实现 中 假设 状态 机 互 不 相交 。 

实际 中 ， 由 于 消息 延迟 的 原因 ， 并 不 能 总 是 很 理想 地 接收 输入 的 规划 基 消 
息 。 例 如 ， 智 能 体 在 执行 动态 重 分 配 之 后 马上 就 期 望 消息 到 来 可 能 会 导致 冲突 ， 
这 是 由 于 消息 在 环境 中 检测 到 相关 事件 发 生 之 前 就 已 发 送 。 因 此 应 短暂 地 忽略 这 
种 冲突 ， 而 延 时 时 间 与 进行 〈 重 ) 分 配 后 的 时 间 间 隔 有 关 。 

通过 一 种 三 向 式 握 手 协议 来 实现 同步 协议 。 如 果 每 个 参与 智能 体 都 处 于 状态 
z 使 得 转移 1= (2, 2’, b) 是 同步 * 的 一 个 元 素 并 且 均 认为 满足 由 则 可 声明 已 
准备 好 同步 。 每 个 参与 智能 体 都 认可 该 声明 ， 如 果 接 收 到 一 个 来 自 其 他 参与 智能 
体 的 所 有 声明 的 确认 信号 后 ， 就 开始 广播 一 个 准备 好 信号 。 此 时 支持 共同 信念 ， 
并 根据 STrans 规则 进行 同步 转移 。 一 个 认为 已 满足 相应 条 件 $ 的 智能 体 一 旦 接 
收 到 一 个 准备 好 信和 号， 就 会 立刻 支持 共同 信念 。 如 果 在 信念 建立 期 间 产 生 冲 突 信 
息 ， 则 相应 的 智能 体会 通知 团队 终止 执行 。 

可 通过 通信 建立 一 种 同步 方式 的 共同 信念 来 解决 协同 攻击 问题 ”“” ， 这 是 
在 不 可 靠 的 异步 通信 条 件 下 ， 已 知 无 确定 解 的 问题 ， 因 此 任何 同步 转移 协议 都 只 
能 是 近似 准确 的 。 认 为 大 多 数 条 件 下 三 向 式 握手 协议 已 可 满足 ， 当 然 也 可 很 容易 
地 将 该 基本 协议 扩展 到 n 次 握手 协议 。 

一 个 认为 是 特定 规划 类 型 中 领导 者 的 智能 体 根据 第 6 章 中 介绍 的 冲突 检测 和 
消解 机 制定 期 广播 分 配 权威 消息 。 每 个 消息 都 要 确认 发 送 智能 体 ， 以 使 得 可 采用 
侍 强 凌 弱 算法 ， 另 外 每 个 消息 中 都 包括 了 对 规划 类 型 的 全 部 分 配 。 若 领导 者 智能 
体 不 再 发 送 消息 ， 就 认为 冲突 问题 已 解决 。 这 样 团队 就 切换 回 正 常 工 作 模式 ， 因 
此 该 方式 也 可 处 理 领导 者 智能 体 发 生 损 坏 的 问题 。 

7.5.2 当前 团队 估计 

对 于 一 个 以 协调 一 致 方式 运行 的 团队 ， 对 团队 中 参与 智能 体 的 集合 ( 即 当 
前 团队 的 组 成 ) 进行 估计 非常 重要 。 尽 管 ALICA 假设 事先 已 知 整个 智能 体 团 队 
4， 但 这 并 不 意味 着 所 有 可 能 参与 的 智能 体 都 能 实际 运行 ， 而 且 智 能 体 还 可 能 随 
时 丧失 行为 能 力 。 因 此 每 个 智能 体 都 需要 跟踪 上 活动 团队 ， 该 团队 定义 为 参与 顶 
层 规划 的 智能 体 集合 , 即 {al Be+In(a, Po, Tos 2%) fo 

若 智 能 体 a 接收 到 一 条 来 自 智能 体 b 的 消息 ， 则 可 推断 智能 体 b 在 发 送 消息 
时 是 活动 的 。 假 设 所 有 智能 体 都 在 可 相互 通信 的 范围 内 ， 还 可 根据 期 望 的 智能 体 
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个 数 进行 估计 ， 而 不 是 以 接收 的 消息 。 由 于 ALICA 智能 体 以 频率 frin BR Sinan HE TI 
广播 消息 ， 因 此 丢失 消息 的 个 数 在 i fon BM t+ fi 范围 之 间 ， 其 中 1 为 接收 到 最 
后 一 条 消息 的 时 间 ， 假 设 通信 拌 动 可 忽略 不 计 。 如 果 f;, Snax LIER, DBAS 


能 体 就 可 估计 期 望 的 消息 个 数 为 n =0.5 Soin tfan) © 

一 个 特定 智能 体 期 望 而 未 接收 到 的 消息 个 数 越 多 ， 则 原因 是 消息 丢失 的 概率 
越 小 。 给 定 消 息 发 送 的 概率 为 pw， 则 由 于 通信 和 错误 所 导致 消息 丢失 的 概率 可 大 
致 估计 为 


Pima = (1 -p,) ” 
然而 这 是 一 个 非常 粗略 的 近似 。 由 于 经 常 出 现 网 络 突 发 错误 ， 因 此 每 个 消息 
的 概率 相互 不 独立 。 智 能 体 依 次 发 送 的 消息 可 能 会 受到 同一 个 突 发 错误 的 影响 ， 
而 且 不 同 智能 体 同 时 发 送 的 消息 也 可 能 受 该 错误 的 影响 。 
目前 针对 突 发 错误 及 其 概率 分 布 已 进行 了 广泛 研究 。 最 常用 的 是 Neyman-A 
传播 模型 "”， 该 模型 最 初 用 于 描述 试验 田中 的 幼 忠 分 布 。 利 用 该 模型 ， 突 发 错 


误 的 长 度 可 用 一 个 泊 松 分 布 描述 (参见 参考 文献 [44]) ， 由 此 可 将 n 条 连续 消 
息 的 丢失 概率 模型 作为 长 度 为 上 > 7 的 一 个 突 发 错误 的 概率 : 


pike a) =1-e% A (7.1) 
假设 已 知 机 器 人 损坏 的 先 验 概率 估计 为 ke (aa) ， 则 每 个 智能 体 可 由 下 式 
来 估计 整个 活动 团队 : 
{alB In( 4,0 47520) } = {4|Paomm(@) <p(k>n(a))} (7.2) 
式 中 nla) 一 一 智能 体 期 望 但 没有 接收 到 的 连续 消息 的 个 数 。 


式 (7.2) 和 ,表示 如 果 智能 体 估计 Pan (a) >p (ken (ac) ， 则 从 信念 基 的 
In(a, p, 7, z) 中 去 除 所 有 信念 。 由 此 ， 例如, 若 puuw(a) =10°, fiw =15, 
fain =5 以 及 和 A =10， 表示 智能 体 假设 另 一 个 智能 体 a 在 丢失 22 个 连续 消息 之 后 
损坏 ， 即 经 过 2. 2s 没有 从 a 接收 到 任何 消息 。 在 机 器 人 足球 领域 ， 这 些 值 都 是 
比较 合理 的 假设 。 

值得 注意 的 是 ， 这 种 估计 没有 对 不 同 智能 体 所 接收 消息 之 间 的 任何 依赖 关系 
进行 建 模 。 而 且 当 预计 智能 体会 在 长 时 间 内 进入 和 超出 通信 范围 时 ， 将 不 再 满足 
这 种 简单 的 近似 。 另 外 ， 除 了 接收 消息 或 丢失 消息 ， 还 可 能 会 有 其 他 证 据 。 一 个 
智能 体 可 感知 到 另 一 个 智能 体 对 环境 的 影响 ， 并 利用 该 信息 推断 其 内 部 状态 。 参 
见 Huber 和 Durfee”) 对 如 何 实现 无 通信 下 联合 意图 的 讨论 。 在 此 ， 假 设 有 关 另 
一 个 智能 体 状 态 的 所 有 感知 信息 都 可 以 通信 方式 表示 ， 或 通过 行为 来 直接 (如 
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无 线 通信 连接 ) 或 间接 对 环境 产生 影响 。 
在 移动 机 器 人 场合 ， 机 器 人 会 移动 超出 通信 范围 ， 则 接收 消息 的 概率 是 其 在 
环境 中 位 置 的 一 个 函数 : 


pa(At) = | A poslat) ,pos(b,t) )d 


式 中 nm 一 一 最 后 一 条 消息 的 接收 时 间 ; 
pos (a, t) 和 pos(b, t) 一 一 在 时 刻 : 发 送 智能 体 和 接收 智能 体 的 位 置 ; 
Pm (At) 一 一 在 给 定 发 送 智能 体 和 接收 智能 体 在 环境 中 
的 位 置 的 条 件 下 ,At 期 间 内 成 功 发 送 一 条 消息 的 概率 分 布 。 

如 果 环 境 中 具有 无 线 电 信号 或 干扰 源 对 象 ， 则 概率 分 布 可 以 是 任意 复杂 的 。 
采用 射线 跟踪 和 其 他 仿真 技术 可 获得 该 概率 分 布 的 精确 近似 ， 但 在 复杂 环境 中 计 
算 量 很 大 (参见 参考 文献 [114，145 ] ) 。 通 常 ， 这 种 精细 模型 并 不 适用 于 实时 
性 的 概率 估计 。 实 际 中 更 多 采用 计算 速度 较 快 的 方法 ， 这 是 通过 牺牲 准确 率 来 提 
高 速度 的 。 通 常 这 些 方法 仅 考 虑 视 距 和 距离 ， 基 于 信 品 比 " ”来 估计 概率 ， 或 利 
用 测试 包 来 测量 连接 质量 。 就 本 书 而 言 ， 仅 采用 式 (7.1) 的 简单 估计 方法 。 


7.6 本 童 小 结 


根据 第 6 章 所 介绍 的 理论 基础 ， 本 章 阐述 了 ALICA 引擎 架构 。 另 外 ， 还 介 
绍 了 用 于 ALICA 程序 的 建 模 工具 和 交换 格式 。 尽 管 ALICA 5] SEH] ie A BUTE fa] — 
种 智能 体 架 构 中 ， 但 在 此 仅 讨 论 通用 架构 基础 上 的 必要 特性 。 最 后 ， 介 绍 了 参考 
实现 中 采用 的 通信 方法 以 及 一 种 基于 期 望 消息 个 数 来 估计 团队 成 员 存活 性 的 方 
式 。 作 为 开源 代码 ， 参 考 实现 可 公开 获得 。 
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第 8 章 广义 ALICA 


8.1 简介 


命题 式 ALICA 提供 了 多 种 建 模 选 项 来 处 理 多 智能 体 情况 ， 然 而 仅 限 于 命题 
式 语义 可 导致 特定 语言 元 素 爆 炸 式 增长 ， 其 中 最 受 影 响 的 是 行为 。 由 于 在 pALI- 
CA 中 每 个 行为 都 是 静态 的 ， 因 此 不 管 在 何 种 情况 下 调用 都 基本 上 会 执行 相同 的 
动作 。 尽 管 可 将 行为 看 作 黑 箱 问 题 而 在 某 些 程度 上 取消 该 限制 ， 并 且 因 此 成 为 一 
个 与 信念 基 交 互 作 用 的 图 灵 完 备 的 程序 ， 但 这 并 没有 在 ALICA 中 表示 ， 因 此 不 
能 通过 内 部 ALICA 的 方式 进行 协调 和 推理 。 在 此 ， 旨 在 提出 一 种 行为 和 规划 可 
参数 化 的 更 精细 的 建 模 技术 以 使 得 可 适用 于 不 同情 况 。 由 此 一 种 通用 的 行为 
DriveTo(x) 可 用 于 表示 DriveTo,,,..,.. 、DriveTo ,和 DriveTov .等 多 种 行为 。 

若 需 要 不 确定 域 的 参数 ， 则 相应 的 程序 不 能 再 用 pALICA 表示 。 接 下 来 ， 将 
在 一 些 示 例 域 中 专门 讨论 命题 式 程序 的 问题 。 之 后 提出 一 种 广义 的 ALICA， 其 中 
规划 和 行为 都 可 参数 化 ， 且 只 允许 在 内 存 范围 内 进行 在 参数 空间 中 的 推理 。 
8.1.1 标准 情况 

首先 考虑 RoboCup 场景 中 的 一 个 问题 。 在 机 器 人 足球 中 ， 比 赛 总 是 由 于 犯 
规 而 中 止 ， 如 足球 出 界 或 机 器 人 犯规 。 这 种 犯规 之 后 应 重新 是 “标准 情况 ”。 此 
时 裁判 员 将 足球 放置 在 场 上 ， 指 定 一 名 进攻 方 的 队员 ， 并 命令 机 器 人 自 定位 。 经 
过 机 器 人 作出 反应 并 完成 定位 的 一 段 时 间 ， 裁 判 员 重新 宣布 比赛 开始 。 比 赛 一 旦 
开始 ， 在 允许 防守 方 抢 球 之 后 ， 进 攻 方 需要 传 球 。 标 准 情况 中 的 定位 过 程 是 由 各 
种 规则 来 决定 的 ， 例 如 要 求 防守 机 器 人 与 足球 之 间 的 距离 不 得 小 于 一 定 距 离 
(如 3m) 。 由 于 经 常会 发 生 标 准 情况 ， 因 此 能 很 好 定位 的 团队 具有 显著 优势 。 由 
此 对 于 标准 情况 ， 团 队 需 花费 大 量 的 时 间 和 精力 ， 其 至 经 常会 要 求 团队 针对 不 同 
对 手 或 环境 条 件 〈 如 光照 不 均匀 ) 应 有 特定 的 定位 能 力 。 在 给 定 不 同 标准 情况 
( 掷 界 外 球 、 任 意 球 、 点 球 等 ) 以 及 对 手 的 条 件 下 ， 可 能 会 有 许多 不 同 的 策略 ， 
这 非常 类 似 于 实际 的 足球 比赛 。 
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图 8. 1 给 出 了 一 个 pALICA 中 实现 定位 策略 的 示意 图 ， 其 中 只 有 有 关 该 规划 
中 所 包含 实际 策略 的 少量 信息 ， 即 只 需要 一 个 机 器 人 作为 罚球 队员 来 传 球 ， 另 一 
个 机 器 人 作为 接 球 队员 ， 并 安排 其 他 机 器 人 执行 防守 任务 。 由 于 在 这 三 种 行为 中 
包含 了 实际 的 定位 策略 ， 因 此 对 于 相同 情况 的 不 同 策略 也 非常 相似 。 尽 管 在 
PALICA 中 对 通过 应 用 规划 类 型 、 条 件 和 效用 函数 可 很 容易 地 对 相同 问题 采用 和 
保持 几 种 策略 ， 但 如 果 没有 每 个 策略 下 几 种 特殊 行为 的 话 ， 则 无 法 精确 表示 定位 
问题 的 解 。 这 就 是 本 章 开 始 时 所 提 到 的 命题 式 爆炸 问题 。 在 开发 过 程 中 ， 难 以 处 
理 和 保持 大 量 的 必要 行为 ， 这 可 利用 广义 ALICA 来 避免 。 


FKPosExecutor | 


| FKPosDefend 


图 8. 1 pALICA 中 标准 情况 的 规划 示例 


在 此 并 不 详细 描述 图 8. 1 中 三 种 行为 的 可 能 实现 方法 ,而 只 是 提炼 出 应 具有 
的 三 种 共同 特性 。 

相同 的 执行 过 程 : 所 有 行为 都 是 用 于 到 达 球 场 上 一 个 特定 而 不 同 的 位 置 的 。 
给 定 目 标点 ， 采 用 相同 的 算法 和 参数 来 确定 电动 机 命令 (如 路 径 规划 和 速度 控 
HAF) o 

复杂 的 决策 过 程 : 由 于 每 个 行为 的 目的 不 同 ， 因 此 计算 实现 过 程 也 不 同 。 实 
现 算 法 可 能 会 非常 复杂 ， 并 且 会 受 实现 误差 的 影响 。 

交互 作用 : 在 相互 依赖 的 位 置 上 行为 会 相互 作用 。 例 如 ， 罚 球 队员 、 足 球 和 
接 球 队员 应 构成 一 条 直线 ， 然 后 沿 该 直线 传 球 。 

在 此 ， 认 为 这 些 都 是 普遍 特性 ， 同 样 也 会 在 其 他 场景 中 发 生 ， 即 一 些 智能 体 
需要 在 环境 中 动态 协调 一 阶 实体 (在 该 示例 中 是 位 置 ) 。 
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从 规划 方法 和 机 器 学 习 方 法 的 角度 来 看 ， 图 8. 1 所 示 的 结构 也 并 非 理 想 情 
况 。 通 常 ， 规 划 方 法 和 学 习 方 法 都 是 通过 搜索 一 个 假设 空间 [如 所 有 程序 空间 
(参见 参考 文献 [96] ) 或 任务 图 (参见 参考 文献 [106]) ] 来 对 输入 问题 进行 
求解 的 。 搜 索 空间 的 一 个 主要 特点 就 是 行为 问题 。 对 于 定位 问题 ， 就 是 要 将 搜索 
空间 减少 到 可 用 行为 的 各 种 组 合 ， 具 有 结构 少 以 及 用 于 引导 搜索 的 信息 少 的 
特点 。 

相 比 之 下 ， 一 阶 方法 可 大 大 减少 所 需 行为 的 个 数 。 在 定位 问题 的 特殊 情况 
下 ， 相 对 于 上 述 提 到 的 常用 执行 算法 ， 只 需 一 种 行为 。 另 外 ， 由 于 一 阶 方法 不 再 
需要 复杂 的 黑箱 ， 人 允许 规划 和 学 习 算 法 搜索 一 个 表示 更 加 丰富 的 问题 解 。 

一 个 可 用 于 该 搜索 空间 的 机 器 学 习 研究 领域 是 归纳 逻辑 编程 (ILP) Nien- 
huys-Cheng 和 Wolf"! 对 ILP 进行 了 深入 介绍 。 已 有 多 种 方法 来 解决 一 阶 规划 问 
题 ， 如 情景 演算 中 的 回归 规划 算法 05241 或 Kersting FA 提出 的 关系 贝尔 曼 算 
法 。 在 后 面 的 章节 中 ， 将 通过 规划 、 学 习 或 其 他 方式 生成 规划 的 所 有 算法 都 称 之 
为 一 种 生成 算法 。 

8.1.2 积木 世界 

另 一 个 具有 激励 性 的 示例 是 积木 世界 (Blocks World) ， 这 是 最 初 由 Wino- 
grad07] 提 出 的 一 个 著名 的 人 工 智能 玩具 问题 。 在 积木 世界 中 ,智能 体 或 机 器 人 
任务 是 构建 几何 图 元 之 外 的 预定 义 结构 。Nilsson51 提出 了 一 种 基本 的 积木 世界 ， 
其 中 几何 图 元 限制 为 立方 体积 木 块 和 一 个 容纳 所 有 积木 的 大 平台 。 每 块 积 木 都 是 
一 个 单一 的 其 他 物体 (平台 本 身 或 另 一 块 积 木 )。 另 外 ， 每 块 积木 都 是 光滑 的 ， 
或 还 有 一 个 其 他 积木 。 如 果 机 器 人 不 能 搬运 积木 块 ， 则 可 抓 起 一 个 平滑 积木 ， 将 
积木 放 在 平台 上 或 其 他 积木 上 。 这 种 基本 的 积木 世界 或 许 是 STRIPS 规划 最 著名 
的 例子 S。 这 甚至 会 导致 某 些 实际 环境 中 的 实验 ， 如 Toussaint 等 人 "” 提出 的 。 
在 后 面 的 章节 中 ， 将 这 种 基本 的 积木 简称 为 积木 世界 。 

一 个 积木 世界 问题 的 解 是 形式 为 Pickup(4) Put(A, Table), Pickup(B) 
Put(B, A) … 的 一 系列 动作 。 由 于 STRIPS 规划 是 命题 式 规划 ， 因 此 这 些 动作 实 
际 上 是 预先 设置 好 的 常数 ， 且 由 于 积木 块 个 数 有 限 ， 不 会 构成 理论 问题 。 用 一 个 
pALICA 程序 来 表示 该 规划 非常 简单 ， 每 个 动作 都 对 应 于 状态 中 的 一 个 行为 ， 这 
些 状态 由 通过 转移 成 功 完成 的 相应 动作 来 连接 (ILE 8.2)。 

然而 ， 以 这 种 方式 来 处 理 问 题 可 能 需要 在 具有 个 积木 块 的 积木 世界 中 执行 
ma + 个 行为 。 产 生 这 么 多 的 行为 是 非常 低 效 的 ， 尤 其 是 大 多 数 行为 几乎 相同 ， 


O 列 出 结合 STRIPS 规划 器 的 积木 世界 域 应 用 论文 、 著 作 和 报告 已 超出 本 书 范畴 。 在 本 书 撰写 时 ， 在 
Google 搜索 引擎 中 搜索 “条 积木 世界 ”关键 词 可 返回 3. 2 x10’ 个 结果 。 
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处 理 积木 世界 
wee.) OO 


Al | Pickup A| [Put A Tabie | Pickup B| | Pu B_A| 


图 8.2 pALICA 中 的 一 个 STRIPS 行为 序列 


即 抓 起 一 个 积木 块 或 将 其 放置 在 某 处 。 因 此 执行 一 个 积木 世界 的 规划 问题 具有 与 
标准 情况 场景 下 相同 的 共同 执行 特性 ， 然 而 积木 世界 方法 中 没有 相互 作用 ， 只 有 
一 个 机 器 人 执行 规划 ， 而 无 需 进一步 决策 ， 这 是 由 于 提供 的 是 一 个 静态 且 确 定 的 
规划 。 

接 下 来 ， 将 介绍 一 种 基于 本 书 第 2 部 分 所 讨论 的 pALICA 的 一 种 广义 ALI- 
CA。 表 明 广 义 ALICA 更 具有 表现 力 且 保持 了 动态 适应 情况 变化 的 能 力 。 


8.2 行为 参数 与 规划 变量 


通过 引入 类 似 于 IndiGolog' ”或 FLUX'' 等 编程 语言 中 一 阶 动作 的 参数 化 行 
为 可 解决 多 种 行为 共享 相同 执行 模式 的 问题 。 

定义 8.1 每 个 行为 6 都 具有 一 个 变量 x 的 空 列表 ， 即 行为 参数 。 记 b(x) 
来 表示 具有 参数 x 的 行为 b。 

通过 允许 行为 具有 参数 ， 可 解决 常见 的 执行 模式 问题 。 由 此 使 得 程序 中 一 个 
行为 的 每 次 执行 都 具有 一 组 不 同 的 参数 ， 这 样 就 可 以 只 用 两 种 行为 来 描述 积木 世 
界 规划 : Pickup(x) 和 Put(x，y)。 然 而 尽管 可 以 用 有 限 个 行为 来 表示 无 穷 多 个 
不 同 的 行为 实例 ? ， 从 而 只 需 有 限 数量 的 代码 ， 但 仍 不 足以 处 理 运行 前 值 未 知 或 
部 分 已 知 的 参数 。 这 正如 上 述 标准 情况 场景 下 的 情况 。 

考虑 一 个 简单 示例 : 一 个 机 器 人 的 任务 是 在 办 公 室内 寻找 一 本 书 ， 并 上 前 确 
认 。 在 运行 之 前 ， 由 于 办 公 室 内 有 各 种 不 同 的 书 ， 机 器 人 不 知道 将 要 寻找 哪 本 特 
定 书 。 经 过 一 段 时 间 的 搜索 并 将 在 信念 基 中 增加 相应 的 信念 之 后 ， 机 器 人 才 会 明 
确 应 上 前 查看 的 具体 书 。 图 8.3 给 出 了 相应 的 一 个 规划 。 机 器 人 不 断 执 行 
LookAround 行为 ， 直 到 在 信念 基 中 表示 了 一 本 书 ， 并 将 该 书 作 为 参数 传递 给 Co- 


O ”或 更 准确 地 说 ， 是 内 存 范 围 内 的 最 多 个 实例 
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to(x) 行为 。 


Book(x) 


Goto(x) | 


图 8.3 规划 示例 : 寻找 一 本 书 


然而 ,FindBook 规划 在 pALICA 中 无 法 表示 ， 即 便 允 许 行 为 具有 参数 。 还 需 
要 条 件 中 自由 变量 和 行为 参数 之 间 的 连接 关系 。 这 样 就 产生 了 推理 任务 ， 在 本 例 
中 可 在 规划 中 定义 书 的 确认 。 同 理 ， 还 允许 在 规划 中 定义 标准 情况 场景 下 位 置 的 
确认 。 

接 下 来 ， 对 规划 、 状 态 和 规划 类 型 ( 即 一 个 ALICA 程序 中 的 结构 元 素 ) 进 
行 概念 扩展 以 使 得 在 规划 中 具有 变量 并 使 其 相互 关联 。 

定义 8.2 每 个 规划 p 具有 一 个 唯一 变量 x 的 空 列表 ， 记 为 p(x)。 每 个 规 
划 类 型 P 具 有 一 个 变量 x 的 空 列表 ， 记 为 P(x)。 

定义 8.3 (规划 独立 性 ) ” 所 有 规划 、 规 划 类 型 和 行为 都 是 各 自 标准 化 的 。 

因此 ， 每 个 规划 和 规划 类 型 都 具有 一 组 由 条 件 指定 的 唯一 变量 。 根 据 定义 
8.3， 不 同 的 规划 和 规划 类 型 应 与 两 两 不 相交 的 变量 集 相 关联 。 为 使 得 不 同 规划 
的 变量 相互 关联 ， 引 入 绑 定 的 概念 。 

定义 8.4 ”每 个 规划 p(x) 中 的 每 个 状态 s 都 定义 了 一 个 称 为 绑 定 的 可 能 为 
空 的 替换 9(s), 使 得 9(s) = [yt oo, hetl ， 其 中 ， 所 有 x; 都 是 相 
应 规划 变量 中 的 变量 ,， 即 (Yx) vars (x) Ca, Ay As 中 的 行为 或 规 
划 类 型 变量 ， 即 (Vy) yie U Gey eetaviats) VPCF) etina Yo 

定义 8.5 每 个 规划 类 型 P(x) 定义 了 一 个 称 为 绑 定 的 可 能 为 空 的 蔡 换 
OCP), 使 得 0(P) = (yia, e aiet ， 其 中 ， 所 有 % 都 是 P(x*) 变量 
中 的 变量 ， 即 (Yx) vars (x) Cx, 同时 所 有 y; 为 P 中 的 规划 变量 ， 即 
(Vy) xe U p07) erz) Y 

由 此 ， 每 个 状态 和 每 个 规划 类 型 都 声明 了 规划 、 规 划 类 型 以 及 所 包含 行为 的 
一 种 局 部 参数 化 ， 使 得 变量 相互 关联 ， 且 人 允许 静态 替换 。 值 得 注意 的 是 ， 绑 定 并 
不 需要 绑 定子 规划 或 行为 中 的 所 有 变量 ， 而 完全 可 能 不 绑 定 子 变量 。 同 理 ， 父 规 
划 的 变量 可 经 常任 意 出 现在 一 个 绑 定 中 。 
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通过 规划 中 的 条 件 ， 规 划 变量 可 作为 一 种 动态 绑 定 的 表示 方式 。 例 如 ， 转 移 
的 一 个 相关 条 件 可 以 是 刚刚 发 现 的 一 本 书 ， 并 将 该 条 件 与 一 个 规划 变量 绑 定 ， 该 
规划 变量 又 通过 状态 与 一 个 行为 变量 绑 定 。 通 过 人 允许 在 规划 变量 中 含有 自由 变量 
的 条 件 可 很 容易 地 实现 。 然 而 在 某 些 场合 中 ， 可 能 不 希望 对 每 个 变量 都 确定 一 个 
唯一 的 下 限 值 。 例 如 在 上 述 的 标准 情况 场景 中 ， 精 确 位 置 的 计算 是 非常 繁琐 的 ， 
而 实际 上 或 许 只 需 列 出 该 位 置 应 满足 的 一 组 特性 即 可 。 另 外 ， 由 于 可 利用 绑 定 来 
向 规划 层次 结构 传递 变量 ， 使 之 最 终 可 作为 行为 参数 ， 因 此 可 能 只 需 对 每 个 变量 
值 限定 为 适合 于 在 每 层 上 处 理 问 题 的 值 ， 而 具体 细节 留 给 子规 划 。 在 这 个 特定 情 
况 下 ， 高层 上 的 规划 可 描述 一 般 问题 的 约束 ， 例 如 机 器 人 必须 遵守 的 比赛 规则 
集 ， 然 后 可 充分 利用 绑 定 在 一 个 规划 类 型 中 的 特定 子规 划 策 略 。 每 个 子规 划 又 可 
以 根据 一 个 特定 策略 进一步 约束 变量 ， 如 一 个 在 对 方 半 场 罚 任意 球 的 风险 较 大 的 
进攻 策略 ， 或 一 个 团队 处 于 领先 情况 下 的 防守 策略 。 

该 思想 启发 了 可 采用 约束 规划 方法 ， 其 中 每 个 独立 规划 不 需要 传递 给 行为 的 
基本 参数 ， 但 必须 满足 状态 要 求 或 约束 的 基本 解 。 这 样 多 智能 体 团 队 的 行为 可 以 
一 种 声明 方式 进行 表示 ， 并 且 与 底层 求解 器 的 具体 实现 相 解 而 。 另 外 ， 生 成 算法 
并 不 需要 关心 生成 条 件 是 否 满足 所 有 情况 下 传递 给 行为 的 所 有 变量 。 

FLUX 或 GOLOG ™ 等 编程 语言 要 求 每 个 动作 在 执行 时 必须 完全 满足 。 这 是 
非常 重要 的 ， 因 为 在 执行 相应 的 动作 之 前 不 再 进行 推理 ， 并 且 没 有 定义 一 个 如 
Goto(x) 的 非 基 本 动作 的 执行 结果 。 相 反 在 此 可 允许 非 基本 的 约束 参数 ， 通 过 查 
询 所 需 约束 求解 器 来 得 到 一 个 合适 值 ， 从 而 通过 一 个 中 间 推 理 步 又 来 求解 非 基 本 
动作 的 问题 。 在 8.4 节 中 ， 将 正式 讨论 ALICA 中 的 约束 公式 概念 。 在 第 9 章 ， 
将 讨论 求解 约束 问题 的 方法 并 动态 提供 基本 值 。 


8.3 智能 体 变量 


尽管 规划 变量 的 概念 可 允许 通过 一 阶 项 来 表现 和 描述 合作 ， 但 事实 证 明 ， 在 
某 些 情况 下 ， 不 足以 准确 地 反映 团队 的 意图 行为 。 

在 此 考虑 Campbell 和 Wu 所 采用 的 常见 的 捕食 场景 。 其 中 ， 一 个 智能 体 
团队 或 智能 体 群 ”的 任务 是 搜索 和 撒 取 某 些 物体 (如 食物 或 资源 ) ， 并 同时 保 
护 基地 或 梨 穴 。 该 场景 主要 用 于 检验 角色 或 任务 分 配 技术 ， 以 动态 决策 每 个 智能 
体 是 应 去 捕食 还 是 保护 基地 。 在 该 情况 下 ， 运 行 前 分 配给 某 个 任务 的 智能 体 的 具 
体 个 数 未 知 ， 只 是 给 定 了 上 限 ， 甚 至 在 运行 前 智能 体 总 的 个 数 都 未 知 。 另 外 ， 捕 
食 或 保护 任务 的 智能 体 个 数 还 可 动态 变化 。 

在 给 定 一 个 合适 的 角色 和 任务 分 配方 法 的 条 件 下 ， 应 具体 指定 每 个 个 体 行 
为 。 目前， 利用 ALICA 中 的 约束 条 件 来 表示 这 些 行为 需要 规划 变量 。 在 给 定 智 
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能 体 的 捕食 或 保护 任务 下， 每 个 规划 变量 应 分 别 表示 出 智能 体 的 目标 位 置 ， 则 变 
量 个 数 是 可 能 参与 的 智能 体 个 数 的 两 倍 。 由 于 每 个 智能 体 在 某 一 时 刻 只 能 执行 一 
个 任务 ， 因 此 实际 使 用 的 变量 最 多 只 有 一 半 ， 这 样 在 所 有 情况 下 的 约束 问题 可 能 
非常 复杂 。 男 外 ， 在 实际 情况 下 ， 真 正 激活 的 智能 体 个 数 总 是 小 于 可 能 激活 的 智 
能 体 个 数 。 

示例 8.1 考虑 下 面 捕食 场景 中 的 这 个 简单 示例 约束 : 


( Va,b e A)MinimalDist(a,b,£)Va=b (8.1) 

( Va) In(a,P, protecting ,z) —>Near( a, Base ) (8.2) 
(Va,b)a4b \In(a,P, Foraging Search) A In(b,P, Foraging , Search ) 

—MinimalDist( a,b ,SearchRadius ) (8.3) 


约束 条 件 表明 所 有 智能 体 应 相互 保持 最 小 距离 [ 见 式 (8.1) ] ， 分 配 为 保护 
任务 的 智能 体 应 果 在 基地 附近 [ 见 式 〈8.2) ] ， 而 分 配 为 捕食 任务 的 处 于 搜索 状 
态 下 的 智能 体 应 相互 保持 较 大 距离 ， 以 更 有 效 地 进行 搜索 [ 见 式 (8.3) ] 。 

特定 域 谓词 Near 和 MinimalDist 可 表示 为 

Near(a,/) i Jp)Pos(a,p) Av (p-x-l. x)? +(p.y-l. y)? <100 


def 


MinimalDist (a, b, d) = ( d3p,, pa ) Pos (a, p) A Pos (a, p) 


Jp, tx =p. ta) + (pt y-p ty)? >d 

这 种 制定 约束 的 简洁 方式 充分 利用 了 C(Pred，Func) 中 的 特定 域 谓 词 和 
Pos， 并 隐 含 地 假设 这 是 第 二 个 参数 的 函数 。 这 些 谓词 类 似 于 情景 演算 中 流 的 也 
数 '""，， 但 并 不 表示 环境 状态 或 其 相关 知识 ， 而 是 表示 意图 值 (预期 值 ) ， 或 更 
确切 地 说 ， 是 允许 对 意图 或 责任 进行 约束 。 因 此 ， 这 些 约束 可 看 作 规划 的 一 种 扩 
展 声明 ， 否 则 以 一 种 程序 的 方式 来 形成 意图 。 

为 能 够 规范 从 在 某 一 特定 时 间 点 执行 规划 或 任务 的 实际 智能 体 中 提取 的 约 
东 ， 应 利用 一 组 相应 的 公理 来 弥补 约束 和 信念 之 间 的 差距 。 

定义 8.6 设 F 为 二 元 谓词 符号 的 一 个 有 限 集合 ， 对 于 每 个 PeF,， 设 台中 
包含 : 

(VaeA)((4x)P(a,x)) AC (Vx,y)P(a,x) AP(Cay) 一 x =y) 

因此 ， 在 给 定 第 一 个 参数 是 智能 体 的 条 件 下 , 正中 的 所 有 元 素 都 是 其 第 二 参 
数 的 函数 。 将 pALICA 的 信念 公理 E, 〈 定 义 5.6) 进行 扩展 以 包括 %,。 该 形式 
下 由 信念 约束 的 谓词 称 为 智能 体 函 数 流 。 

由 此 ，5 中 的 每 个 公式 会 保证 每 个 智能 体 a 中 都 存在 一 个 单一 值 x， 以 满足 
Pla, x), thE, Pla, x) 会 根据 名 称 P 对 智能 体 a 附加 一 个 变量 。 在 
Yum 中 对 进行 特定 域 扩展 可 以 使 得 智能 体 可 修改 和 推理 的 其 他 特定 域 元 素 具 
有 类 似 结构 。8. 4 节 将 阐述 如 何 将 这 种 形式 的 约束 集成 到 规划 中 。 
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8.4 ALICA 中 的 约束 条 件 


8.3 节 介 绍 了 约 东 公式 的 一 些 示例 。 直 观 上 ， 一 个 约束 就 是 以 某 种 方式 限制 
了 域 实体 有 效 选择 的 一 个 公式 。 这 可 由 以 下 定义 进行 正式 描述 : 

定义 8.7 一 个 约束 是 具有 自由 变量 x =x,，…，x,，n 宇 0 的 一 个 公式 ee 
L。 中 称 为 对 x WAR. BS x RRE D; 中 的 一 个 值 。 对 于 信念 基 B 的 一 个 约束 
公式 的 解 为 一 个 替代 6， 使 得 xO 为 基本 解 ，46 与 了 B 保持 一 致 ， 目 x0eD, x… x 
Dio 

根据 定义 5.9, Bee ,中 表示 对 于 逻辑 C 和 6 中 的 信念 基 B, EAER a WEH p 
为 一 个 计算 解 ， 这 也 构成 了 查询 公式 的 一 个 解 。 

定义 8.7 反映 了 2.4 节 中 一 个 约束 满足 问题 最 一 般 的 概念 。 接 下 来 ， 为 简单 
起 见 ， 避 免 明 确 表明 域 。 由 于 示例 8. 1 中 包含 寻找 定量 值 的 变量 ， 因 此 该 示例 中 
的 约束 并 不 适合 定义 8. 7。 由 于 相应 的 各 种 排序 是 有 限 的 ， 所 以 这 只 是 一 个 技术 
问题 ? 。 因 此 ， 示 例 8. 1 中 所 用 的 公式 可 展开 成 相应 的 约束 。 

定义 8.8 将 的 展开 约束 表示 为 (4)。T($8) 可 通过 递归 替代 由 收 
得 到 : 

© XIF p, r, z, WR In(a, p, T, z) 或 Succeeded(a, p, 7) FEW "P 
发 生 ， 则 通过 As (Ww far sAl) 所 有 (( Va) y) 发 生 。 

。 对 于 某 些 p, t, z, WR In(a, p, T, z) BM Succeeded(a, p, 7) 在 由 中 
发 生 ， 则 通过 Va(yw lar>41) 所 有 (( da) y) KE. 

。 如 果 P (A, x) 在 y 中 发 生 ， 根据，P 为 一 个 智能 体 函 数 流 ， 且 4e A， 
WHat yira) 所 有 ( (Vx) y) 发 生 ， 其 中 x 是 P 和 4 独 有 的 一 个 变量 。 

。 如果 P (A, x) 在 yw 中 发 生 ， RIE, PHAR RE RR, HAEA, 
MDE y |x) 所 有 ( (dx) y) 发 生 ， 其 中 zx, 是 P 和 4 独 有 的 一 个 变量 。 

在 量词 消去 步骤 中 ,谓词 In 和 Succeeded 的 条 件 用 于 保证 只 有 智能 体 范围 内 
的 变量 是 可 替换 的 。 显 而 易 见 ， 随 着 每 次 操作 ， 不 断 在 公式 中 去 除 量词 ， 就 会 结 
束 约束 展开 。 还 要 注意 ， 只 要 已 知 4， 就 可 进行 约束 展开 ， 即 在 一 个 ALICA 智能 
体 的 初始 化 阶段 ， 认 为 .4 在 整个 运行 期 间 都 是 静止 的 。 

若 发 生 在 规划 p 中 的 公式 由 为 针对 p 的 本 地 规划 ， 且 4 中 每 个 变量 至 多 一 次 
作为 智能 体 函 数 流 中 的 第 2 个 参数 ， 则 该 公式 适用 于 约束 展开 。 值 得 注意 的 是 ， 
根据 标准 语义 ， 可 认为 空 的 连接 等 效 于 T 且 空 的 分 离 等 效 于 上 。 


O ”在 此 没有 采用 多 类 逻辑 (参见 参考 文献 [19, 52]) 来 定义 ALICA， 但 原理 是 相同 的 
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考虑 下 列 捕食 场景 中 的 附加 约束 : 
(Va,x)In(a,P,Foraging,Search)—Pos(a,x) A Unexplored( x) (8. 4) 
直观 上 ， 通 过 利用 背景 谓词 Unexplored (这 可 能 是 在 机 器 人 信念 状态 中 表示 
的 某 种 地 图 ) 来 约束 机 器 人 的 位 置 变量 ,该 约束 使 得 搜索 机 器 人 向 未 探索 空间 
运动 。 随 着 机 器 人 的 不 断 运动 ， 之 前 未 探索 的 区 域 逐 渐 已 知 ， 因 此 Unexplored 也 
是 动态 变化 的 。 尤 其 是 当 一 个 捕食 机 器 人 运动 到 已 知 区 域 的 边界 时 ， 地 图 不 断 更 
新 ， 并 在 每 次 迭代 中 ， 不 断 探索 之 前 未 探索 的 位 置 ， 因 此 约束 满足 问题 的 解 也 需 
要 不 断 更 新 。 从 语义 上 ， 由 于 一 个 约束 问题 的 解 总 是 与 信念 基 有 关 ， 因 此 这 种 对 
当前 信念 的 依赖 关系 可 由 定义 8.7 反映 。 

ALICA 中 的 约束 意味 着 控制 智能 体 的 行为 ， 因 此 可 存在 于 规划 条 件 ， 如 作 
为 前 置 条 件 的 一 部 分 或 转移 保护 条 件 的 一 部 分 。 由 于 约束 描述 了 智能 体 应 处 环境 
的 特性 ， 因 此 与 AgentSpeak ”中 的 目标 实现 相关 。 为 区 别 条 件 和 约束 ， 在 此 引 
入 一 种 不 属于 底层 语言 L( Pred,Func) 的 公式 之 间 的 新 二 元 运算 符 。 

定义 8.9 ”如 果 中 为 [中 的 一 个 表述 ,而 y 为 [中 的 一 个 约束 ， 则 boy tec 
中 的 一 个 保护 性 约束 。 

AWE, dow (MA p RFP YU) 所 表达 的 意思 是 ， 如 果 中 满足 ， 则 约束 消 
也 应 满足 。 根 据 Frühwirth ”提出 的 约束 处 理 规则 ， 该 语法 和 语义 都 是 松 耦 合 
的 。 接 下 来 ， 将 规范 化 这 种 概念 ， 并 在 8. 6 节 中 讨论 运行 过 程 中 如 何 处 理 保护 性 
约束 。 

从 某 种 程度 上 看 ， 这 种 结构 似乎 并 是 不 必要 的 。 首 先 ， 约束 集 在 连接 性 
(和 分 离 性 ) 下 除了 表述 (RAR) 之 外 是 封闭 的 。 其 次 ， 如 果 在 一 给 定 约束 下 
无 解 ， 则 相应 的 条 件 应 评估 为 假 ， 然 而 将 约束 等 效 为 条 件 是 目光 短 浅 的 。 正 如 
2.4 节 中 所 述 ， 取 决 于 C 的 表示 ， 确 定 一 个 解 的 复杂 性 可 以 相差 很 大 ， 例 如 从 
2SAT'” 的 易 处 理 问题 、 一 般 有 限 域 约束 的 NP 难题 到 实数 域 任 意 非 线性 不 等 式 
的 不 确定 性 问题 。 另 外 ， 尽 管 找 到 一 个 CSP 问题 的 解 并 不 比 证 明 存 在 一 个 解 ” 
更 难 ， 但 这 并 不 是 根据 某 个 目标 函数 寻找 最 优 解 的 问题 。 在 9.6 节 中 ， 将 介绍 
ALICA 中 的 约束 优化 ， 即 可 通过 一 个 目标 函数 来 比较 不 同 的 解 。 

由 此 寻找 一 个 约束 的 解 需要 花费 大 量 时 间 ， 而 且 即 使 可 能 是 确定 性 的 一 类 问 
题 ， 但 求解 器 也 可 能 为 了 追求 效率 而 牺牲 完备 性 (如 Selman 等 人 "提出 的 
WalkSAT 等 局 部 搜索 ) 。 取 决 于 约束 编程 语言 、 所 用 求解 器 以 及 所 处 场景 的 表现 
性 ， 对 于 保护 运算 符 可 能 选择 不 同 的 语义 。 

在 此 区 别 关 于 保护 运算 符 的 两 种 解释 ， 即 弱 保 护 解 释 和 严格 保护 解释 。 在 对 
于 C 中 的 约束 求解 ， 以 及 有 限 规模 约束 满足 问题 的 难题 容易 处 理 的 情况 下 ， 应 采 
用 一 个 需要 存在 解 的 严格 保护 解释 。 在 难以 求解 约束 或 所 采用 的 求解 器 不 完备 
时 ， 一 个 弱 解 释 就 更 加 有 意义 。 
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定义 8. 10〈 弱 守护 解释 ) ” 当 且 仅 当 满足 由 时 ， 一 个 保护 约束 中心 少 在 弱 解 
释 下 才 会 满足 。 

因此 ， 在 弱 解 释 下 ， 评 估 保 护 约束 的 一 个 智能 体 可 证 明 保护 条 件 并 声明 
约束 。 

定义 8. 11 ( 强 守 护 解释 ) ” 当 且 仅 当 其 在 弱 解 释 下 满足 ， 并 对 于 智能 体 当 前 
配置 中 满足 yw 中 所 有 自由 变量 的 某 一 替换 9， 满足 yw9， 则 一 个 保护 约束 p ~y 
才 会 在 强 解 释 下 满足 。 

在 强 解 释 下 ， 为 评估 保护 性 约束 ， 智 能 体 还 需要 证 明 约 束 解 的 存在 。 然 而 由 
于 约束 可 能 通过 自由 变量 相互 关联 ， 因 此 这 样 的 一 个 证 明 仅 在 由 智能 体 配 置 提 供 
的 背景 下 才 有 意义 。 在 8.5 节 中 ,将 讨论 这 一 背景 是 如 何 表示 的 ， 并 在 8.7 节 中 
描述 如 何 由 该 背景 和 约束 公式 产生 一 个 约束 满足 问题 。 

当 规 划 中 附加 有 保护 约束 时 ， 弱 守护 解释 和 强 守 护 解 释 的 不 同 更 加 明显 。 在 
弱 守 护 下 ， 如 果 智 能 体 评 佑 该 守护 为 真 ， 则 进行 转移 。 而 在 强 守护 下 ， 智 能 体 还 
必须 证 明 约 束 解 存在 。 若 两 种 情况 都 满足 ， 则 约束 就 会 有 效 ， 并 影响 智能 体 的 行 
为 。 同 理 ， 如 果 在 运行 条 件 下 无 法 得 到 一 个 约束 解 ， 则 必须 中 止 执行 相应 规划 ， 
但 只 要 守护 条 件 满足 ， 参 与 智能 体 就 会 在 弱 守 护 解 释 下 继续 执行 。 在 这 种 情况 
下 ， 即 使 暂时 没有 找到 解 ， 约 束 也 将 继续 影响 智能 体 的 行为 。 

理想 情况 下 ， 只 有 在 守护 条 件 保 证 约束 问题 的 解 存在 时 ， 才 会 形成 守护 约 
束 ， 可 以 很 容易 地 证 明 ， 这 时 强 解 释 和 弱 解 释 等 效 。 虽 然 利 用 某 种 包容 模型 
(如 Buntime 的 广义 9 包容 ) 可 构建 一 个 对 于 该 守护 条 件 的 过 于 宽泛 的 近似 ， 
但 这 些 方法 已 超出 本 书 范畴 。 

为 将 约束 集成 到 ALICA 中 ， 相 关公 式 将 从 [中 的 表述 扩展 到 守护 约束 。 

定义 8.12 如果 P(x) 是 一 个 有 效 的 ALICA 规划 ， 则 其 前 置 条 件 、 运 行 时 
条 件 以 及 转移 过 程 中 的 所 有 公式 都 是 守护 约束 p ~, 业 ， 使 得 4 为 一 个 表述 ,而 风 
为 一 个 用 于 展开 的 公式 ， 这 样 就 将 T) 中 的 所 有 自由 变量 都 作为 智能 体 函数 
流 或 * 之 中 的 第 二 个 参数 。 另 外 ， 前 置 条 件 和 运行 时 条 件 的 守护 是 p 的 局 部 
规划 。 

后 置 条 件 描述 了 一 个 行为 或 规划 要 实现 的 目标 。 一 旦 某 个 智能 体 实 现 该 目 
标 ， 则 中 止 执行 相应 的 规划 或 行为 ， 因 此 后 置 条 件 中 不 会 有 约束 。 对 行为 进行 类 
似 扩展 可 使 得 前 置 条件 和 运行 时 条 件 中 包含 约束 。 

定义 8.13 如果 4b(x) 为 一 个 有 效 的 ALICA 行为 ， 则 其 前 置 条 件 和 和 运行 时 
条 件 为 守护 约束 6 ob, (Gb 为 一 个 表述 ， 而 消 为 一 个 用 于 展开 的 公式 ， 这 样 
就 将 Cb) 中 的 所 有 自由 变量 都 作为 智能 体 函 数 流 或 之 中 的 第 二 个 参数 。 

值得 注意 的 是 ， 行 为 仍 戏 入 在 规范 行为 规划 中 ， 如 5.7 节 所 述 。 
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8.5 约束 条 件 库 


约束 逻辑 规划 系统 通常 具有 作为 一 个 约束 库 的 特点 ， 即 在 操作 层 上 可 看 作 一 
个 具有 并 执行 约束 的 库 。 一 旦 出 现 新 的 信息 ， 则 “激活 ”相关 约束 ， 并 根据 约 
束 处 理 规则 来 传递 信息 。 一 旦 发 现 所 存储 的 约束 集合 不 一 致 ， 则 回溯 系统 。 

从 一 个 更 加 声明 性 的 角度 来 看 ， 约 束 库 可 看 作 广义 的 经 典 替 换 ， 这 是 由 于 表 
示 可 能 估 值 信息 的 约束 以 及 任 一 替换 都 可 表示 为 一 组 约束 。 

在 ALICA 中 ， 每 个 智能 体 都 具有 一 个 约束 库 ， 该 约束 库 中 包含 了 一 组 智能 
体 认 为 目前 正 激活 的 约束 。 由 于 约束 都 是 存在 于 规划 或 行为 中 ， 因 此 约束 库 中 的 
每 个 约束 都 是 由 相应 的 规划 或 行为 注解 。 

定义 8. 14 ”一 个 约束 库 是 一 个 可 能 为 空 的 元 组 (P, p) Æ, HF PEH 
规划 ， 而 $ 是 一 个 约束 。 

在 经 典 的 约束 规划 系统 中 ,约束 库 由 简化 规则 或 传播 规则 进行 修改 。 例 如 ， 
删除 一 个 在 所 有 情况 下 都 满足 的 约束 ， 或 两 个 约束 合并 为 一 个 约束 。 在 ALICA 
中 ， 随 着 智能 体 遍 历 规 划 树 ， 可 从 约束 库 中 增加 或 去 除 约束 。 因 此 在 每 个 时 间 
点 ， 智 能 体 都 必须 能 够 去 除 之 前 所 声明 的 约束 ， 这 可 通过 由 规划 集 对 每 个 约束 进 
行 注 解 来 实现 。 一 个 由 规划 p 声称 的 约束 中 可 作为 (1p| ，$) 增加 到 约束 库 中 ， 
这 就 可 以 在 给 定 规划 的 条 件 下 来 确定 约束 。 在 基本 情况 下 ， 约 束 集 只 包括 一 个 规 
划 。 在 8.6.2 节 中 ,将 介绍 一 个 根据 Frihwirth'” 来 反映 约束 传播 的 操作 规则 ， 
可 得 到 一 个 具有 多 个 元 素 的 集合 。 

在 此 ， 将 定义 5.1 中 的 智能 体 配置 概念 进行 扩展 以 包含 一 个 约束 库 。 

定义 8. 15 (智能 体 配 置 ) 一 个 ALICA 中 的 智能 体 配置 是 一 个 元 组 (B, 了 7， 
E, R, G), ， 使 得 : 

© (B, Y, E, R) 是 pALICA 中 的 一 个 智能 体 配置 ; 

o G 是 一 个 约束 库 。 

对 于 任意 一 个 智能 体 ae.A，Conf (a) 表示 该 智能 体 的 配置 。 初 始 的 智能 体 
配置 包括 一 个 空 约束 库 ， 即 形式 为 (B，G@6,， ©, G@6，5)， 使 得 有 不 对 团队 状态 
进行 任何 假设 。 尤 其 是 ， 其 中 不 包含 任何 形式 In (a, p, r, z) 的 信念 。 


8.6 规则 


类 似 于 pALCIA ,一 个 ALICA 智能 体 的 内 部 状态 可 根据 一 组 操作 规则 进行 转 
移 。 与 pALICA 不 同 的 是 ， 这 些 规则 还 与 一 个 包含 一 组 有 效 约束 或 意图 的 约束 库 
有 关 。 在 8.6.1 节 ,将 5.13 节 中 介绍 的 原始 规则 系统 扩展 到 一 般 情 况 ， 并 描述 


112 自主 移动 机 器 人 行为 建 模 与 控制 


约束 库 如 何以 及 在 何 时 进行 更 新 。 之 后 在 8. 6. 2 节 中 ， 讨 论 一 种 根据 约束 处 理 规 
则 中 来 更 新 约束 的 扩展 。 
8.6.1 提升 命题 式 ALICA 的 规则 
5. 13 节 中 描述 的 规则 系统 大 体 上 可 直接 应 用 到 通用 ALICA。 在 此 仅 需 强调 
一 个 智能 体 配 置 的 新 元 素 ， 即 包含 可 影响 当前 智能 体 行 为 的 有 效 约束 集合 的 约束 
库 。 接 下 来 ， 对 于 相应 的 pALICA 规则 ， 定 义 每 个 ALICA 规则 。 其 中 大 部 分 规则 
的 变化 都 很 小 ， 只 是 受 约束 库 的 影响 。 在 此 记 
(B, Y, E, R) 一 ' (B I", E, R’) 
: (B, F, £, R, © = OF, F, BP, BS 
来 表示 如 果 应 用 pALICA PLM Te SH (B, Y, E, R) BRA (B', Y', E', 
R') ， 则 原始 配置 为 (B, Y, E, R, C) 的 一 个 智能 体 也 将 更 新 配置 为 (B', 
7',，E'，R’'，G')。 对 于 大 多 数 规则 ,已 足以 撤销 不 再 执行 的 规划 约束 。 在 此 将 
一 个 限于 规划 基 Z 的 约束 库 C 表示 为 C (G, Y): 


CCG, T) = | (S, y) 1 (S, 4) EGA (Ypes) (p, 7, 2) er] 
在 利用 规则 执行 一 个 规划 ， 必 须 声 明 相 应 的 前 置 条 件 和 运行 时 条 件 的 约束 的 
其 他 情况 下 。 为 表示 简单 起 见 ， 利 用 一 个 宏 DCG, Y) 来 表示 撤销 有 关 不 再 
执行 的 规划 的 所 有 约束 ， 并 声明 7 中 有 关 规 划 前 置 条 件 和 运行 时 条 件 的 所 有 
约束 : 

D(G,Y) =C(6,7) U [Cpl p) I (p,7,2) erAPre(p) = ( x) V Run 
(p) = (9 ~)| 

对 约束 库 无 影响 的 规则 : 规则 Sense 、BSuccess、TSuccess、BAbort、BRedo、 
BProp 和 RoleAlloc 以 及 除了 Cmd,, 之 外 的 冲突 检测 和 消解 的 所 有 规则 都 不 会 改变 
规划 基 ， 因 此 也 不 会 改变 约束 库 : 

(B, Y, E, R) + (B’, 7’, BE’, R') 

(B, Y, E, R, G) 一 (B', Y', E', R', GC’) 
st 中 S = | Sense, BSuccess, TSuccess, BAbort, BRedo, BProp, RoleAlloc, 
Sense,,, Adapta, Reset.,, Auth,, TakeAuth,,, DropAuth,,, DropCmd,, Reset, | 。 

限制 约束 库 的 规则 : 规则 PAbort, PRedo, PReplace, PProp 和 NExpand 会 从 

规划 基 中 去 除 三 元 组 ， Se Seed a 约束 的 约束 库 : 


Te 


Tes: 


(B, Y, E, R) — (B', Y', E', R’) 
(B, Y, E, R, G) — (B', Y', E', R', C (G, Y")) 
式 中 S= |PAbort, PRedo, PReplace, PProp, NExpand} 。 
声明 和 撤销 约束 的 规则 : 规则 Alloc, Adapt 和 Cmd。. 会 通过 增加 和 去 除 三 元 
组 来 改变 规划 基 。 这 可 通过 仅 针对 仍 在 执行 规划 的 限制 约束 ， 以 及 新 执行 规划 的 


Tes: 


第 8 章 广义 ALICA 773 


前 置 条 件 和 运行 时 条 件 的 声明 约束 来 影响 约束 库 。 值 得 注意 的 是 ， 这 三 条 规则 仅 
增加 初始 状态 的 三 元 组 。 
oe (B, Y, E, R) > (B', 7", E', R’) 

: (B, Y, E, R, G) > (B', Y', E', R', D (G, Y) 
式 中 S= {|Alloc, Adapt, Cmd, } 

清除 约束 库 的 规则 : 通过 规则 Init， 一 个 智能 体 可 初始 化 其 配置 。 在 发 生 失 
败 或 向 顶层 规划 传播 失败 的 情况 下 ， 可 利用 规则 PTopFail 来 处 理 失 败 ， 并 触发 一 
个 重 初始 化 。 在 上 述 两 种 情况 下 ， 清 空 约束 库 ， 并 对 智能 体 清除 所 有 之 前 表示 为 
约束 的 意图 。 


T 


(B, Y, E, R) > (B', Y', E', R’) 
(B, Y, E, R, G) > (B', Y, E', R, ®) 
现在 只 剩 下 处 理 转 移 的 两 种 特殊 规则 。 
转移 规则 : 利用 转移 规则 ， 知 能 体 可 在 状态 机 中 实现 一 个 转移 ， 由 此 产生 相 
应 的 声明 约束 : 


Te |Init, PTopFail} : 


oe (B,Y,E,R) = (B',Y",E',R’) 
"(BY ,E,R,G)—(B' ,Y',E',R',C(G,Y') Ut (ipt ow) }) 
式 中 一 一 智能 体 发 生 转移 (z, 2, bi) WAR; 
Pp 一 一 包含 该 转移 的 规划 。 

由 此 ， 随 着 一 个 进入 新 状态 的 转移 ， 智 能 体会 在 约束 库 中 增加 相应 的 约束 。 
值得 注意 的 是 ， 由 于 任何 一 个 表述 $ 都 可 重 记 为 一 个 等 价 的 守护 约束 paT, Al 
此 约束 可 表示 为 T。 另 外 ， 去 除 不 再 执行 的 规划 的 所 有 约束 。 

同步 转移 规则 : 与 转移 规则 类 似 ， 同 步 转移 规则 也 是 在 约束 库 中 增加 约束 ， 
并 去 除 智能 体 不 再 执行 规划 的 约束 。 然 而 由 于 在 同步 行为 中 涉及 多 个 智能 体 ， 则 
应 增加 同步 中 每 个 转移 的 约束 : 

(B, Y, E, R) > (B', T’, E', R’) 
(B, Y, E, R, G) > (B', Y', E', R', C (G, Y) UF) 

由 此 使 得 若 ; 为 所 考虑 的 同步 行为 , p As 发生 时 的 规划 ， 则 FF= | (1p| y) 
LERA EE 

将 规则 集 集 成 到 约束 库 的 扩展 与 $. 14 节 中 所 讨论 的 特性 保持 一 致 ， 即 规划 
基 仍 符合 规划 基 公 理 ， 没 有 引入 其 他 孤立 行为 ， 并 且 智 能 体 仍 信任 其 所 执行 的 意 
图 行为 。 这 是 由 于 对 规则 的 提升 只 是 产生 了 用 于 处 理 约束 库 的 规则 ， 而 对 智能 体 
配置 中 其 他 元 素 的 处 理 仍 保持 不 变 。 

8.6.2 约束 处 理 规则 
Fréhwirth ©) 定义 了 一 种 基于 约束 处 理 规则 (CHR) 的 声明 性 编程 系统 。 尽 


STrans: 
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管 这 些 规 则 并 不 是 本 书 工作 的 重点 ,但 也 可 能 会 增强 一 个 具有 约束 处 理 规则 的 
ALICA 引擎 来 简化 随后 对 求解 特定 变量 查询 等 推理 步骤 。 目 前 尚未 在 具体 实现 
中 得 到 应 用 ， 在 此 简单 描述 如 何 形 成 这 种 扩展 。 

由 Frühwirth ”所 给 出 的 下 列 定 义 反映 了 CHR 编程 的 语法 。 

定义 8.16 ”一 个 CHR 程序 是 一 个 CHR 的 有 限 集 ， 每 个 CHR 都 是 下 列 形式 


之 一 : 

o 一 种 简化 CHR 的 形式 为 : H, 0, HOG,, +, GIB, …, By 

o 一 种 传播 CHR 的 形式 为 : H,, 0, HOG,, …, G1 By, …, Bpo 

o 一 种 简化 传播 CHR 的 形式 为 : H, 0, Hi\ Ai, 7, HOG, …, GI 
Bi; =, Bye 

其 中 , i>0, j>0, k>0, 1>0, HAA, =, ,为 CHR 约束 的 一 个 非 空 
序列 ， 守 护 6G, ，…，G, 是 一 个 内 建 约束 的 序列 ，B, +, BEAN EARN 
CHR 约束 的 序列 。 


在 CHR 框架 中 ， 内 建 约 束 是 完全 由 CHR 定义 的 更 复杂 约束 的 基本 构建 块 。 

直观 上 ， 如 果 对 于 一 条 简化 规则 中 的 每 个 约束 头 H,.， 在 约束 库 中 都 存在 一 
个 实例 五 og， 且 可 证 明 规则 的 相应 守护 实例 Co, +, Go 具有 答案 09， 使 得 0 
不 能 代替 规则 头 中 的 变量 ， 则 所 有 Ho 都 可 从 约束 库 中 去 除 ， 并 由 约束 体 B,o0 
替代 。 传 播 规 则 相对 简单 ， 但 不 能 从 约束 库 中 去 除 约束 头 。 简 化 传播 规则 是 简化 
和 传播 两 者 的 结合 ， 会 去 除 Hio，…，Hio， 但 不 能 去 除 有 ,1,o，…H,o。 所 得 到 
的 这 种 系统 是 图 灵 完 备 (Turing complete) | | 的。 

在 此 ， 可 提供 一 种 将 传播 CHR 集成 到 ALICA 中 的 操作 规则 。 与 原始 CHR 
系统 不 同 ， 不 再 从 约束 库 中 去 除 ALICA 中 的 一 个 约束 ， 直 到 智能 体 不 再 执行 相 
应 的 规划 。 给 定 一 组 作为 ALICA 的 CHR 扩展 的 传播 规则 ， 下 列 规 则 CProp 定义 
了 对 智能 体 配 置 的 相应 更 新 : 

(Bk, (CCA…AG) o) A (Si, Mo) EGMN (S,, Ho) eG 
(B, Y, E, R, G) — (B, Y, E, R, G') 
式 中 H, +, HG, 0, G1 B,, +, B——CHR 扩展 中 的 一 条 传播 规则 ; 
0 一 一 守护 条 件 证 明 的 计算 解 ; 


CProp; 


G'=GU | (T, Bo0) | 1<i<k}; 

Te U$S; 

如 果 对 于 当前 信念 集 满足 守护 条 件 ， 且 一 个 规则 头 实例 有 效 ( 即 在 约束 库 
中 ) ， 则 规则 CProp 将 声明 在 约束 库 中 增加 一 条 传播 规则 体 。 类 似 于 在 CHR 编程 
语言 中 的 规则 应 用 ， 来 为 避免 没有 中 止 ， 对 同一 约束 应 至 少 应 用 一 次 CRrop 规 
则 。 利 用 该 规则 ， 就 可 能 传递 部 分 CHR 语义 工作 于 ALICA。 

由 于 约束 库 是 动态 的 且 在 任意 时 刻 反映 有 效 约 束 集 ， 因 此 不 可 能 以 上 述 方式 
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eA TCL. FERAE (ipl, p) 和 ( ipo}, bo) 是 约束 库 中 一 部 
分 的 一 个 实例 。 应 用 简化 规则 可 去 除 这 两 个 元 组 ， 并 增加 一 个 相应 简化 规则 体 的 
元 组 ， 如 (1p1，ps| ，y)。 如 果 智 能 体现 在 不 执行 p,， 则 必须 从 约束 库 中 撤销 
这 一 结果 ， 因 为 p, 的 约束 不 再 相关 。 因 此 ， 智 能 体 还 要 撤销 可 能 仍 有 效 的 原始 
约束 中 。 


8.7 查询 


到 目前 为 止 ， 约 束 都 是 在 一 个 约束 库 中 维护 和 管理 的 ， 但 这 并 不 会 影响 智能 
体 的 行为 。 通 过 查询 可 实现 上 述 要 求 。 在 智能 体 、 行 为 以 及 其 他 部 件 的 运行 过 程 
中 都 可 查询 约束 库 。 

在 此 ， 来 区 分 只 需 证 明 存在 解 的 存在 性 查询 和 需要 具体 解 的 具体 查询 这 两 类 
查询 。 如 上 所 述 ， 尽 管 这 些 问 题 相当 复杂 ， 但 一 旦 利用 了 9.6 节 中 的 约束 优化 ， 
这 就 不 再 是 难题 ， 因 此 需要 进行 区 分 。 

在 强 守 护 解 释 下 〈 见 定义 8.11) ， 评 估 规 划一 条 件 时 ， 操 作 规则 可 进行 存在 
性 查询 。 

定义 8.17 一 个 查询 g 是 一 个 由 规划 或 行为 的 查询 内 容 <、 可 计算 值 的 变量 
列表 wv 和 w 中 自由 变量 的 约束 公式 由 组 成 的 三 元 组 (e, Vv, 中 )。 

为 了 响应 查询 ， 对 于 当前 的 智能 体 配置 (B, 了 ，E，R，G) ， 可 构建 一 个 相 
应 的 约束 满足 问题 。 直 观 上 ， 这 可 通过 从 向 顶层 规划 提出 查询 的 内 容 中 向 上 遍历 
规划 树 ， 收 集 所 有 有 效 约束 并 在 遍历 过 程 中 绑 定 来 实现 。 根 据 局 部 性 原理 ， 不 考 
虑 在 子 节点 和 劳 支 节点 中 有 效 的 约束 ， 由 此 规划 疡 提出 的 查询 或 许 比 其 父 规划 提 
出 的 同样 查询 更 加 具体 。 

图 8.4 中 的 递归 函数 1 可 反映 规划 树 的 向 上 遍历 过 程 。 第 一 种 情况 是 达到 顶 
层 规划 时 的 终止 条 件 。 第 二 种 情况 是 相关 性 ， 即 车 查询 内 容 c 为 一 个 行为 或 一 个 
规划 类 型 ， 则 利用 父 状 态 的 绑 定 0(z) 并 增加 与 相应 父 规划 p 关联 的 所 有 有 效 约 
束 。 最 后 一 种 情况 是 利用 相应 规划 类 型 P 的 绑 定 来 处 理 规划 。 

利用 这 种 方式 ， 用 于 查询 (c, v, o) 的 遍历 i(c, v, p, ©, Y, G) 就 可 
产生 一 个 由 要 求解 的 CSP y AUST BB ae A HR 9 组 成 的 二 元 组 (w，9)。 所 
VA, CSP 可 构建 为 p 和 约束 库 G 中 所 有 相关 有 效 约 束 的 结合 。 

替换 9 反映 了 查询 变量 与 查询 内 容 之 间 的 关系 。 由 于 绑 定 了 状态 和 规划 类 型 
之 间 的 传递 ， 每 个 变量 都 可 由 9 映射 到 规划 树 中 发 生 概 率 最 高 的 规划 。 这 种 替换 
对 解 的 跟踪 和 协调 具有 重要 作用 ， 这 将 在 9. 5 节 介绍 。 

随后 ， 智 能 体 可 证 明 B Ly 是 对 查询 的 响应 。 在 一 个 具体 查询 情况 下 ，767 
就 是 所 得 的 解 天 量 。 
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(ġ.0) C= Py 
t(p,X. b0'NG ) (p,r,z) EYA (cE Behaviours(z) 
Ve €PlanTypes(z)): 


式 中 X=X6(z) 
$’ =PA(z)A 


ie X,6,0.7,G)= AGRv)(P.PEGA pE PAvE vars((W ANY; 
0'=000(), 
1(P, X907,G) (c, r, z’) EYA P € PlanTypes(z) ^ 
ce P 


式 中 X'=X0(P); 


$'= $0(P); 
8 =906(P). 


图 8.4 CSP 构建 : 规划 树 的 自 下 而 上 遍历 


示例 8.2 对 于 一 个 用 于 在 RoboCup 场景 中 进攻 的 简单 策略 ， 带 球 的 机 器 人 
朝 可 得 分 的 位 置 运行 。 第 二 个 机 器 人 试图 阻止 对 手 接近 球 ， 其 余 两 个 机 器 人 位 于 
靠近 本 方 球门 处 ， 这 样 万 一 对 手 得 球 ， 可 进行 防守 。 图 8.5 给 出 了 一 个 相应 的 
ALICA 规划 。 
规划 由 三 个 相应 的 任务 组 成 ,一 旦 进攻 队员 朝 对 方 球 门 射 门 (不 管 是 否 得 
分 ) ， 就 认为 已 成 功 完成 。 其 他 机 器 人 的 具体 行为 在 这 个 层面 上 不 会 体现 ， 而 分 
别 由 规划 类 型 Protect(x) 和 DefendGoal 封装 。 
规划 语义 在 很 大 程度 上 是 由 其 运行 时 条 件 由 决定 的 ， 该 运行 时 条 件 可 定 
MA 
b=¢'.. =(( da,z) In(a, Attack, Attacker,z) A HasBall(a) )~, 
T ( ScorePosition (x) A (( Va) In(a, Attack , Defender ,z, ) > 
( 4 defPos ) TargetPos(a,defPos) 入 
Between ( OwnGoal, Ball , defPos) ) ) 
因此 ， 如 果 执 行进 攻 任 务 的 机 器 人 没有 控 球 ( HasBall(a))， 则 必须 放弃 执 
行 该 规划 。 另 外 ,在 由 中 为 自由 变量 的 规划 变量 * 表明 了 进攻 机 器 人 带 球 所 朝向 
的 位 置 。* 是 由 宏 ScorePosition(x) 进行 约束 ， 这 个 宏 的 具体 细节 并 不 重要 ， 但 
应 考虑 对 手 位 置 以 及 机 器 人 足球 装置 的 物理 限制 。 除 此 之 外 , 还 限制 了 位 于 球 
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图 8.5 :规划 示例 : RoboCup 中 的 进攻 策略 


与 球门 之 间 的 所 有 防守 机 器 人 的 智能 体 函 数 流 TargetPos。 关 于 拦截 队员 和 防守 队 
员 位 置 的 具体 细节 留 给 读者 。 

在 每 次 迭代 过 程 中 ， 进 攻 队 员 执 行 的 DribbleTo(x) 将 进行 一 个 查询 (Drib- 
bleTo, (x), T) 来 获得 一 个 目标 位 置 ， 该 位 置 又 转换 为 一 个 运动 指令 。 裔 历 整 
个 规划 树 可 产生 一 个 对 规划 类 型 Protect (x) 或 DefendGoal 没有 任何 约束 的 
CSP TVw。 直 观 上 ， 其 具体 细节 与 进攻 队员 无 关 , 该 CSP 已 足以 得 知 防守 队员 
位 于 其 身后 。 

另 一 方面 ， 拦 截 队 员 执 行 可 实现 根据 进攻 队员 目标 位 置 x 来 约束 拦截 位 置 的 
规划 的 规划 类 型 Protect(x) ， 通 过 遍历 ， 对 Protect(x) 中 拦截 位 置 的 所 有 查询 增 
加 由 的 约束 。 同 理 ， 在 规划 类 型 DefendGoal 中 也 存在 另 一 组 用 于 确定 防守 队员 
位 置 的 约束 。 在 DefendGoal 中 通过 位 置 查询 所 构建 的 CSP 中 包括 ww， 由 于 表 
明了 CSP 的 需求 ， 即 根据 智能 体 函 数 流 TargetPos 对 查询 共享 变量 。 

确定 智能 体 实 际 位 置 与 其 约束 目标 位 置 之 差 非常 重要 。 对 于 某 一 给 定时 刻 ， 
实际 位 置 是 固定 且 不 能 改变 的 ， 而 由 智能 体 函 数 流 TargetPos(a, p) 反映 的 目标 
位 置 要 受到 任意 约束 的 影响 。 


8.8 本 章 小 结 


由 于 许多 问题 无 法 利用 命题 式 ALICA 来 很 容易 地 表示 ， 因 此 利用 规划 、 规 
划 类 型 、 行 为 和 智能 体 的 变量 对 该 基本 语言 进行 扩展 ， 这 允许 约束 作为 部 分 条 件 
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集成 到 编程 语言 中 。 在 此 讨论 了 两 种 不 同 的 守护 约束 语义 ， 即 弱 守护 语义 和 强 守 
护 语义 。 只 要 相应 的 求解 器 不 完备 或 需要 大 量 时 间 来 证 明 解 存在 时 ， 就 应 选择 弱 
守护 。 而 强 守护 要 求 约束 在 激活 之 前 应 有 解 。 

通过 将 约束 库 集成 到 智能 体 配置 中 ， 可 提升 pALICA 的 操作 语义 ,使 其 更 具 
表现 力 。 约 束 库 中 包含 了 规划 执行 的 有 效 约束 集合 。 最 后 ， 在 给 定 一 个 规划 或 行 
为 作为 查询 内 容 时 ,介绍 了 如 何 利 用 部 件 来 查询 变量 值 。 第 9 章 将 重点 介绍 约束 
满足 问题 的 求解 。 


第 9 章 约束 问题 求解 


至 此 , 已 讨论 了 一 个 ALICA 智能 体 如 何 进行 约束 管理 。 约 束 管理 和 更 新 的 
方式 对 所 采用 的 求解 器 没有 任何 限制 ， 根 据 所 形成 的 约束 问题 类 可 选择 相应 的 求 
解 器 。 然 而 讨论 所 有 可 能 或 甚至 合理 的 约束 问题 类 的 求解 器 已 超出 本 书 范畴 。 接 
下 来 ， 将 着 重 考虑 充分 表达 各 种 机 器 人 领域 的 特定 约束 满足 问题 类 。 首 先 ， 研 究 
机 器 人 领域 中 某 些 示例 域 的 表示 需求 。 根 据 这 些 示 例 ， 正 式 定义 一 个 面向 机 器 人 
和 多 机 器 人 领域 的 约束 问题 类 。 之 后 ， 针 对 该 问题 类 提出 一 种 求解 器 ， 并 对 其 进 
行 扩展 以 使 得 可 求解 约束 优化 问题 、 随 时 间 变 化 跟踪 解 ， 以 及 在 团队 中 协调 解 。 


9.1 典型 约束 满足 问题 


再 次 考虑 机 器 人 足球 领域 的 标准 情况 。 在 该 标准 情况 下 ， 若 给 定 球 的 位 置 以 
及 所 有 已 感知 对 手 的 位 置 ， 最 多 需要 确定 四 个 机 器 人 在 场 上 的 位 置 。 大 多 数 情况 
下 ， 这 种 问题 具有 12 维 〈 由 于 由 一 个 二 维 空间 点 和 朝向 来 表示 一 个 位 置 ， 则 每 
个 机 器 人 有 三 维 ) 。 与 工业 领域 中 的 典型 约束 满足 问题 相 比 ， 这 是 非常 小 的 2 。 
然而 正如 9. 4 节 中 将 要 讨论 的 ， 在 软 实时 条 件 下 需要 快速 求解 。 另 外 由 于 这 是 一 
个 动态 域 ， 因 此 解 会 随时 间 变 化 。 

在 标准 情况 下 ， 描 述 行为 所 需 的 特定 约束 通常 可 分 为 以 下 三 类 : 

o 线性 : 使 得 机 器 人 位 于 矩形 区 域 之 内 或 之 外 。 

9 二 次 型 : 在 涉及 机 器 人 与 目标 之 间 的 距离 时 。 

@ 多 项 式 : 在 需要 利用 非常 复杂 的 几何 关系 时 ， 如 周 长 测 试 。 

另外 ， 由 于 可 描述 多 个 不 同 解 ， 这 些 约束 问题 并 不 是 简单 地 连接 。 例 如 ， 考 
虑 一 个 限定 两 个 机 器 人 位 置 的 任意 球 标准 情况 ， 使 得 一 个 机 器 人 (pi) BEER, 
而 另 一 个 机 器 人 (p,) 阻止 对 手 断 球 。 这 样 ， 一 个 直观 的 团队 指令 可 描述 为 : 
“如 果 有 一 个 对 手 能 够 断 球 ， 则 应 由 p, 进 行 拦截 "。 为 阅读 方便 ， 用 两 个 变量 o, 
和 0, 来 表示 目标 。o 的 位 置 。 在 后 面 的 章节 中 ， 将 球 记 为 b。 

如 果 相 对 于 拦截 点 与 球 之 间 的 距离 ， 对 手 。 SERRE d =p, -b 更 近 ， 则 
假设 该 对 手 可 断 球 ， 记 为 


O ”例如 ， 与 可 满足 性 模 理论 竞争 (SMT-COMP) 中 的 基准 问题 相 比 。 
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这 可 由 下 式 表 示 : 
b =v, >0 Av, <1 Av. >v 
因此 ， 如 果 对 手 满足 $4， 则 拦截 队员 应 位 于 对 手 之 前 : 
y= |p, -v,d, +0| <0. 05 
式 中 d 一 一 与 4 正 交 的 矢量 。 

由 于 足球 比赛 中 会 有 多 个 对 手 ， 因 此 要 对 每 个 感知 到 的 对 手 在 约束 问题 中 相 
应 地 增加 一 个 变型 的 py。 

解决 这 种 约束 满足 问题 的 一 种 方法 是 将 每 个 变量 的 域 离散 化 为 一 个 合适 的 机 
格 (AN Lem 宽 )， 并 求解 所 产生 的 有 限 域 问 题 。 然 而 这 会 产生 一 个 非常 大 的 解 空 
间 ， 尤 其 是 需要 考虑 多 个 机 器 人 的 位 置 时 。 在 这 种 特定 情况 下 ， 整 个 空间 可 能 包 
BRA 4.7 x10" 个 元 素 (有 四 个 机 器 人 时 ， 则 为 2.2 x 10” 个 元 素 )。 

这 种 指数 效应 可 轻易 地 抵消 有 限 域 求解 器 对 连续 域 求解 器 的 优势 ， 而 且 由 于 
失真 及 其 他 效应 ， 离 散 化 还 可 能 导致 特定 约束 条 件 的 数值 计算 问题 。 因 此 对 于 这 
种 情况 ， 认 为 实数 上 的 有 理 不 等 式 布尔 组 合 可 构成 最 适合 的 约束 系统 。 

在 另 一 个 场景 中 ， 假 设 一 个 移动 机 器 人 的 任务 是 抓 取 一 个 物体 ， 如 从 厨房 取 
一 杯 咖啡 。 在 机 器 人 上 需要 配置 一 个 机 械 臂 ， 利 用 其 末端 执行 器 可 抓 取 杯子 大 小 
的 物体 。 为 完成 该 任务 ， 机 器 人 具有 四 种 行为 ， 即 DriveTo( x), PositionGripper 
(Y), Grab 和 Release, DriveTo(x) 行为 可 在 建筑 物 中 导航 以 到 达 由 直角 坐标 > 
和 y 以 及 朝向 a 组 成 的 位 置 〈 记 为 ) PositionGripper(y) 行为 是 用 于 控制 机 械 
臂 ， 使 其 末端 执行 器 达到 三 维 矢量 y 所 描述 的 位 置 。 为 简单 起 见 ， 忽 略 指定 未 
端 执行 器 的 朝向 。 另 外 ， 假 设 机 械 臂 的 原点 位 于 机 器 人 中 心 ， 具 有 5 个 转动 关 
节 。 设 MW; 表 示 描 述 第 ;个 关节 相对 于 其 角度 B, 的 转换 矩阵 ， 则 末端 执行 器 在 世界 
坐标 系统 中 的 位 置 可 由 下 式 计 算 : 

y =M;M,M,M,M,M, (x, y, 0, 1 ) 
式 中 ”Mo 一 一 相对 于 机 器 人 朝向 所 产生 的 旋转 。 

除了 标准 情况 的 场景 之 外 ， 逆 运动 学 问题 还 需要 三 角 函 数 ， 如 正弦 函数 和 余 
弦 函 数 。9. 2 节 将 构成 一 个 适合 于 表示 上 述 问题 的 约束 问题 类 。 

该 方程 具有 11 个 变量 ， 每 个 自由 度 一 个 变量 ， 再 加 上 末端 执行 器 的 位 置 变 
量 和 机 器 人 的 位 置 变量 。 因 此 ， 确 定 x My 的 两 个 问题 相互 关联 ， 再 结合 厨房 
中 杯子 的 位 置 以 及 厨房 结构 布局 的 相关 信息 ， 就 可 构成 一 个 简单 的 约束 问题 ， 使 
得 机 器 人 所 有 行为 都 以 某 种 方式 进行 交互 ， 即 机 器 人 应 运动 到 能 抓 取 杯子 的 恰当 
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位 置 。 
9.2 非 线性 连续 约束 满足 问题 


在 参考 文献 [155] 中 ， 以 下 列 方式 讨论 了 非 线性 连续 约束 满足 问题 的 一 类 
问题 : 

定义 9.1 一 个 非 线 性 连续 约束 满足 问题 (CNLCSP) 是 一 个 由 下 列 元 素 组 
成 的 三 元 组 ($, X, C): 

@ 具有 变量 P 的 一 个 命题 公式 由 。 

© RR 域内 的 个 变量 集 X。 

© 每 个 规划 p; e P 确定 一 个 约束 c;e C， 使 得 c; =f:(x*) 00, Hoe |<, 
>, <S, >, =, Al, CX, ŽERA SHERRET RE 

一 个 CNLCSP 可 理解 为 一 个 价值 函数 v: Xeo, it 

yy -人 v (f, (x)) oi0) 
a TUL sett 

We eA P iT, LI. 

HN p 中 所 有 变量 p; 都 可 由 在 经 典 命 题 式 CNLCSP 中 评估 为 T 的 v(p;) 
替代 时 ,vw 可 理解 为 公式 o 的 解 。 

另外 ， 在 参考 文献 [155] 中 ， 对 处 理 来 自 于 完全 不 同 研究 领域 约束 问题 类 
的 求解 器 进行 了 评 佑 ， 如 区 间 传 播 与 分 裂 (参考 文献 [2，171] )、 可 满足 性 模 
理论 (SMT) (参考 文献 [6，48 ] ) 以 及 约束 满足 问题 所 定义 的 场景 局 部 数值 搜 
Ro SMT 是 一 种 求解 结合 特定 求解 理论 与 布尔 满足 性 (SAT) 求解 器 的 不 同 理论 
问题 的 新 方法 ， 因 此 根据 这 种 理论 的 求解 器 可 对 更 具 表 现 力 的 约束 问题 类 具有 
SAT 求解 器 ( 如 参考 文献 [102]) 的 某 些 速度 特性 。 

然而 在 评估 过 程 中 ， 局 部 数值 搜索 方法 在 对 源 自 机 器 人 场景 的 基准 约束 问题 的 
处 理 速度 方面 优 于 其 他 方法 ， 如 两 个 机 械 臂 的 逆 运 动 党、 路径 规划 、RoboCup 中 的 标 
准 情况 以 及 群体 行为 。 在 此 认为 这 是 由 于 所 评估 的 问题 具有 相对 简单 的 布尔 结构 ， 因 
此 SMT 求解 器 不 能 利用 SAT 求解 部 件 的 优势 。 在 9. 3 节 中 将 再 次 采用 该 假设 。 

局 部 搜索 评估 是 基于 Hansen 和 Ostermeier'™ 提出 的 进化 策略 CMA-ES ( 协 方 
差 矩 阵 自 适 应 进化 策略 ) 以 及 Riedmiller 和 Braun ™® 提出 的 弹性 传播 ( Rprop ) 
并 结合 自动 微分 进行 的 。 在 具体 实现 上 ， 利 用 一 种 Shtof 提出 的 改进 AutoDiff 
来 实现 自动 微分 。 基 于 Rprop 的 搜索 在 性 能 上 稍 优 于 进化 策略 。 

为 了 只 利用 数值 局 部 搜索 来 求解 CSP， 需 要 进行 转换 以 产生 一 个 需要 优化 的 
函数 。 为 此 ， 对 输入 公式 进行 转换 以 使 得 通过 随后 应 用 德 摩根 定律 (de Morgan's 
LaW) 和 双重 否定 消除 律 ， 只 能 在 不 可 分 行为 之 前 发 生 和 否定 ， 之 后 通过 转换 了 将 
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所 得 公式 映射 到 一 个 函数 。 在 参考 文献 [155] 中 所 测试 的 四 种 转换 函数 中 ， 下 

列 转换 函数 的 性 能 最 佳 。 

定义 9.2 公式 转换 : 
T dA) =E (To) ,TH)) 
T( dV) =max(T(o) ,T() ) 
T(a<b) = < * (a,b) 
T(a>b) = < * (b,a) 
T(_(a<b)) =< * (b,a) 
T(_,(a>b)) =< * (a,b) 
T(_,(aSb)) = < * (b,a) 
T(_,(a2b)) = < * (a,b) 
T(a=b) =T(a=b -eMNa<b+e) 
T(a4b) =T(a<b-eVa>b+e) 


1 
式 中 È, (a, b) = ee +min (0, b) 其 他 ; 


SE, lab) sŠ (a+b) 


1 a-b<0 
< 其 他 ; 
0 
ô 7 a-b<0O 
a EUGA “ga 其 他 ; 
5x; 
a a=b 
C a b) = 
ôx; : 5 
Be 其 他 ; 


函数 < * 的 定义 类 似 于 < * 。 

由 此 ， 结 果 为 1 类 似 于 一 个 满足 约束 ， 而 不 可 行 的 点 对 应 于 低 于 或 等 于 0 的 
值 。 由 此 产生 的 函数 梯度 中 包括 指向 可 行 区 域 的 不 满足 约束 的 相关 信息 。 这 种 转 
换 并 结合 梯度 方法 (如 具有 自动 微分 的 Rprop) 可 软 实时 地 求解 参考 文献 [155] 
中 的 各 种 约束 问题 。 图 9. 1 给 出 了 所 产生 的 函数 。 

在 实际 场景 中 ， 已 知 每 个 变量 的 边界 。 例 如 ， 在 机 器 人 足球 中 ， 位 置 变量 不 
能 随意 远离 比赛 场地 ， 并 且 角 度 范围 为 -~Ts 因此 对 于 CNLCSP 中 的 每 一 个 
变量 ， 都 可 假设 一 个 包含 所 有 相关 解 的 合理 区 间 。 这 些 边 界 可 看 作 约 束 的 注释 或 
通过 区 间 传 播 从 约束 中 推导 。 表 9. 1 给 出 了 一 个 根据 目前 所 介绍 原理 的 基本 求解 
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APA 


x>0Ax<1 x<0Vvx<1 


图 9. 1 转换 约束 示例 


器 的 伪 代 码 。 该 求解 器 进行 以 不 同 随机 点 初始 化 的 局 部 搜索 ， 直 到 达到 实验 的 上 
IR (Maxtries) 或 找到 一 个 解 (f(p) >0)。 表 中 还 给 出 了 相关 搜索 参数 的 默认 
值 ， 包 括 与 每 个 域 大 小 相关 的 初始 步 长 Sm、 梯度 符号 保持 不 变 时 步 长 增长 因子 
inc、 梯 度 符号 变化 时 步 长 减 小 因子 dec 以 及 最 小 步 长 minV 和 最 大 步 长 maxV 。 

然而 应 用 局 部 搜索 法 求解 CSP 的 最 大 缺点 是 内 在 的 不 完备 性 。 即 使 是 一 个 确 
定性 问题 ， 利 用 局 部 搜索 法 也 可 能 无 解 。 更 重要 的 是 ， 局 部 搜索 法 不 能 降低 约束 问 
题 的 不 满足 性 。 因 此 ， 相 应 的 求解 器 应 与 之 前 介绍 的 弱 守 护 解释 相 结合 。 但 由 于 这 
些 求 解 器 是 用 于 软 实时 条 件 下 ， 因 此 该 问题 可 能 不 是 特别 重要 。 如 果 在 一 定时 间 段 
内 无 法 求 得 解 ， 所 存在 的 解 也 不 相关 。 在 9.4 节 中 ,将 详细 讨论 该 问题 。 

表 9.1 基于 Rprop 的 局 部 搜索 


Solve(csp) { 
// parameters: sinit = 107°, inc=1.2, dec=0.5; 
// minV = 10-'?, maxV = 10!° 
f :=transform(csp); //transform the problem into a function 
let p™" and p™* be the vectors of the lower (upper) bounds, respectively; 
d := number of dimensions of the csp; 
i := 0; 
while(++i < maxTries) { 
p := random point E [p,p pr max] x... X [pin pmax): 
j = 4; 
let sand h be vectors with d elements: 
set all sx :一 Sinit (pe 一 prin); 
set all hy :=0; 
while(++j < maxlterations ) { 
if (f(p) > 0) return p; 
8:= Vf(p); 
for(k:=0; k<d; k++) { 
if (gp -hg > 0) sy := sy: inc; 
if (gk hi < 0) sk := sk- dec; 
Sk := min (max (sx. omg. 
Pk = Dk + sgn(8k) -s 
Px := min(max (px, DP), Pr"): 


h:= g8; 
} 
i 
return FAILURE; 
} 


i 
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9.3 EF SMT Ri ar 


之 前 ， 本 书 声称 在 有 关机 器 人 场景 的 约束 问题 上 ， 局 部 搜索 法 的 性 能 要 优 于 
SMT 求解 器 ， 既 然 如 此 ， 那 么 对 于 一 个 布尔 结构 足够 复杂 的 问题 ， 该 方法 应 更 
加 突出 。 在 此 ， 利 用 下 列 的 问题 发 生 器 来 对 该 假设 进行 评估 ， 该 发 生 器 基于 参考 
文献 [155] 中 所 述 的 正弦 发 生 器 ， 而 该 正弦 发 生 器 又 是 基于 Shang 等 人 "” 提 
HA ACHE ae 

g(n, l, d) = (o, X, C) 
式 中 X 一 一 包含 实数 域 的 d 个 变量 ; 
C 一 一 包含 1 个 如 下 不 等 式 : 
kE TL ,asin(2mx + cy) < 0 

1 
Sale 
在 [ -1, 1) 中 均匀 部 分 的 随机 值 ， 

b, 一 一 在 [ -20, 20] 中 均匀 分 布 的 随机 值 ， 
XX 中 随机 选择 的 变量 ， 

9 一 一 由 随机 采样 测量 的 阅 值 ， 使 得 约束 的 可 行 区 域 近 似 为 整个 域 的 一 半 。 

这 类 似 于 由 一 个 单一 命题 变量 分 解 纯 SAT 问题 的 解 空间 的 比例 。 

© 4 是 一 个 包含 个 子 句 的 随机 3SAT 公式 ， 其 中 每 个 命题 变量 已 可 唯一 确 
A C 中 的 一 个 约束 。 

@ 以 下 列 方式 来 保证 CSP 的 可 满足 性 : 设 矶 中 一 个 随机 点 作为 X 的 价值 
函数 v。 设 P' 为 通过 扩展 v 估 值 为 T 的 命题 变量 集合 ， 然 后 对 于 由 中 每 个 子 句 ， 
选择 一 个 随机 文本 ， 若 其 命题 变量 位 于 P (不 在 已 中 ) MEWE (fA). 

参考 文献 [155 ] 中 评估 的 SMT 求解 器 并 不 适用 于 这 种 约束 系统 。AB 求解 
器 “不 能 处 理 三 角 函 数 (这 在 机 器 人 场景 中 非常 重要 ) ，iSATI” 对 该 基准 约束 
问题 的 性 能 较 差 。 在 此 推断 这 是 由 于 解析 器 存在 缺陷 而 不 能 正确 识别 重复 发 生 的 
事件 。 但 由 于 iSAT 源 代 码 不 公开 ， 这 纯粹 是 猜测 。 

在 此 ， 对 一 个 简单 的 SMT 求解 器 进行 评估 ， 该 求解 器 采用 Moskewicz 等 
人 "提出 的 DPLL 算法 Chaff 对 命题 变量 P 进行 赋值 。 根 据 该 赋值 ， 构 建 一 个 纯 
粹 的 联合 约束 系统 ， 并 利用 9. 2 节 介绍 的 局 部 搜索 法 进行 求解 。 局 部 搜索 法 只 能 
重启 一 次 。 在 其 无 法 求 得 解 的 情况 下 ， 可 调用 Chaff 算法 来 产生 下 一 个 命题 模 
型 ， 并 不 断 重复 该 过 程 。 在 尝试 过 所 有 命题 模型 的 情况 下 ， 两 种 求解 器 均 复 位 ， 
并 重新 开始 执行 该 过 程 。 在 后 面 的 章节 中 ， 将 该 求解 器 称 为 Chaff + Rprop( >， 
max) ， 来 表示 所 采用 的 算法 和 转换 函数 。 


式 中 k= 


a; 


Xij 
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尽管 利用 这 种 SAT 求解 器 和 局 部 搜索 法 的 组 合 方法 使 得 局 部 搜索 法 可 求解 
更 加 困难 的 约束 问题 ， 但 由 于 联合 约束 问题 是 原始 问题 的 一 种 特殊 情况 ， 该 方法 
可 以 两 种 方式 快速 补偿 。 首 先 简 化 用 于 评估 解 空间 中 单个 点 的 公式 ， 其 次 局 部 搜 
索 法 不 必 处 理会 导致 误导 性 场景 的 分 裂 ， 如 参考 文献 [155] 中 所 述 。 当 然 ， 在 
这 种 简单 的 方法 中 ， 两 个 求解 器 相对 独立 ， 相 互 之 间 几 乎 没有 信息 交换 。 一 种 更 
复杂 的 SMT 求解 器 应 能 够 交换 更 多 信息 ， 如 冲突 解释 。 

图 9. 2 给 出 了 nn 变化 时 由 g(n，50,，25) 产生 的 约束 满足 问题 的 求解 结果 。 
最 大 求解 时 间 设 为 30min。 约 束 比 是 指 子 句 和 文本 个 数 之 比 ， 在 该 情况 下 为 n/ 
50。 图 中 每 个 点 都 是 经 过 100 次 实验 后 平均 得 到 的 。 所 有 实验 都 是 在 Linux 
2. 6. 38 系统 的 单线 程 ntel@ Core i7 930 CPU (2.8GHz) 计算 机 上 进行 的 。 


10° ¢ | | T 
F i | Rprop( £4 ,max) * J 
i I Chaff+Rprop( ©, , max) s 
CA 1 1 cree w= ee J 
本 i | a Aye ES( ©, ,max) 8 
10 Fg 一 一 pS ee ey naa aa gf iSat 一 œ 
| [这 JÆ 1 1 
a | Ky aft 1 | | 
vf 1 
i rit gs 1 | 7 
10! b= ------- pensne a ee Eatin see 1 
f are | | ] 
ma | x wae 1 i 1 4 
pe O E ae Paans a boasai] 
Z f ae | | | | 
分 | : Ea 1 1 1 
tol Lecce E Se Wd Peli ain “| 
F 4d | 
H SE er i : 1 
J 1 1 1 
+ 41 > 1 1 1 1 4 
a] i 1 1 
10 人 
re i i A i 
r \ 1 | 1 7 
1 | | i J 
| l 1 
10° L | | | | 
0 2 4 6 8 10 
约束 比 


图 9.2 3SAT 正弦 测试 情况 下 局 部 搜索 法 和 SMT 求解 器 的 性 能 


首先 ， 基 于 Rprop 搜索 (Rprop(y,, max)) 和 基于 CMA-ES 搜索 (ES 
(Z n, max)) 的 性 能 都 与 参考 文献 【155] 中 的 结果 相同 ， 尽 管 此 处 的 问题 更 
难 。 其 次 ， 尽 管 不 同文 本 集 为 常数 ， 局 部 搜索 的 性 能 还 是 要 优 于 SMT 求解 器 
iSAT'*”] 。 当 约束 比 小 于 1 时 ， 简 单 SMT 求解 器 性 能 要 比 单纯 的 局 部 搜索 法 较 
差 ， 但 当 约 束 比 大 于 2 时 ， 其 性 能 就 优 于 局 部 搜索 法 。 之 后 ， 对 于 不 同 的 约束 
HE, Chaff+Rprop(>,, max) 的 性 能 基本 不 变 。 

由 此 可 得 出 结论 ， 与 非 线 性 约束 的 处 理 时 间 相 比 ，SAT 求解 时 间 并 不 显著 (在 
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约束 比 大 约 为 4.24 时 达到 峰值 ”…* )2。 其 次 ， 约 束 比 很 低 时 ，SMT 方法 对 于 
局 部 搜索 将 比 原始 方法 产生 更 难 的 问题 。 

当然 ， 这 是 一 个 高 度 人 为 性 的 测试 情况 ， 主 要 是 用 于 表明 SMT 的 求解 能 力 。 而 
且 如 果 可 将 某 些 性 能 成 功 地 应 用 到 实际 问题 中 ， 本 测试 也 展示 了 巨大 潜力 ， 然 而 这 就 
是 重点 。 图 9.3 给 出 本 实验 中 每 个 求解 器 执行 局 部 搜索 的 次 数 。Chaff + Rprop (2), 
max) 的 运行 次 数 在 约束 比 为 2 时 达到 12. 5， 之 后 就 保持 不 变 。 这 意味 着 在 求 得 解 之 
前 ,平均 只 产生 6 ~7 个 命题 模型 。 假 设 在 约束 比 为 2 ~4 时 命题 模型 的 总 个 数 应 更 
多 ， 这 就 表明 对 于 由 e(n, 1, d) 产生 的 任何 正弦 文本 组 合 ， 存 在 解 的 概率 很 高 。 


| T T m3 ] 
4 1 1 rg Rprop( £4 , max) 
aa as 六 ~~ ~~ Chaff+Rprop( £4.max) « 本 
i | # ES(¥,,max) ---*--- J 
l a i i 
F 1 ti I 1 4 
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nr RRES Wa i eee ee 和 a 
i I "i 1 1 1 4 
| po 1 1 1 
x . a 3 ? i 
g F I i i i 
$ » 1 1 1 1 
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—_ iz 1 I 1 1 af 
z if 1 1 1 
F # de 4 
[one Np mt Se aes gery wn Os hh Fat xh 
10 Cc * i i FS i i 
| i p | | 
¥ | Po | 1 i} 
F. 1 Pe sel i 1 1 
Coe ee | | 
100 Liteon ae | | 
0 2 4 6 8 10 
约束 比 


图 9.3 3SAT 正弦 测试 情况 下 执行 启动 (重启 动 ) 的 次 数 


在 更 实际 的 场景 中 ， 可 能 并 非 如 此 ， 并 且 如 果 有 多 种 形式 的 布尔 结构 ， 则 这 
种 简单 的 SMT 方法 很 快 就 不 可 行 了 。 下 面 的 示例 可 勾勒 出 这 种 场景 。 

示例 9.1 在 机 器 人 足球 中 ， 利 用 四 个 机 器 人 来 应 对 对 方 任意 球 的 一 个 合 j 
的 策略 可 大 致 表述 如 下 : 

© 所 有 机 器 人 均 在 场 内 。 

© 所 有 机 器 人 都 位 于 对 手 罚 球 区 域 之 外 。 

o 每 个 机 器 人 都 位 于 以 足球 为 中 心 、 半 径 为 3m 的 圆 外 ， 或 位 于 本 方 罚 球 区 域 
之 内 。 


© BI Russell 和 Norvig!'*?) 的 相关 研究 。 
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© 如 果 有 某 个 机 器 人 位 于 本 方 罚球 区 域内 ， 则 这 是 唯一 的 一 个 。 

© 没有 一 个 对 手 能 被 一 个 以 上 的 机 器 人 拦截 。 

o 当 位 于 对 手 和 足球 之 间 时 ， 每 个 机 器 人 都 必须 要 拦截 四 个 对 手中 的 一 个 ， 
除非 由 于 其 他 规则 而 无 法 实现 。 

© 一 个 机 器 人 必须 看 着 球 ， 即 机 器 人 自 定 位 以 使 得 球 与 第 二 接近 球 的 对 手 
成 一 条 直线 。 

o 机 器 人 可 在 本 方 球门 前 组 成 一 条 防守 线 。 

@ 机 器 人 必须 观测 相互 之 间 的 最 小 距离 。 

由 于 相应 的 约束 系统 非常 繁琐 ， 在 此 不 具体 描述 ， 然 而 在 合 取 范 式 中 ， 该 约 
RABI 90 多 个 不 同 的 基本 行为 ， 并 在 大 约 220 条 子 句 中 发 生 2000 次 以 上 。 
Rprop(>,, max) 求解 该 问题 需要 大 约 30ms， 而 Chaff+Rprop(},, max) 运行 
Smin 后 终止 执行 。 

有 效 求解 该 约束 问题 的 关键 在 于 需要 将 信息 从 局 部 搜索 后 向 传播 到 SAT 求解 器 。 
这 一 思路 是 作为 DPLL(T) 方法 由 Ganzinger 等 人 提出 的 ”1 ， 其 中 对 于 可 增 量 求解 、 
回溯 并 对 不 一 致 进行 解释 的 理论 T7，Davis-Putnam-Logemann-Loveland 算法 ' 与 求解 
器 相 结合 。 然 而 据 目 前 所 知 ，iSAT 是 唯一 的 一 种 可 处 理 含有 超越 函数 的 连续 非 线性 
约束 的 SMT 求解 器 。 在 此 将 该 问题 作为 今后 的 研究 内 容 。 下 节 将 在 介绍 其 他 求解 器 
特征 〈 如 解 跟踪 以 及 与 其 他 机 器 人 的 求解 器 相配 合 ) 时 考虑 SMT 求解 技术 。 


9.4 实时 性 考虑 


在 实时 场景 下 ， 获 得 一 个 约束 查询 结果 的 效用 会 随时 间 的 推移 而 逐步 变 差 。 
在 某 一 时 刻 :+ Ah ， 时 刻 t 时 的 查询 结果 就 无 用 了 。 男 外 ， 在 1+ At, 时 刻 ， 进 行 
一 个 新 查询 ， 并 且 理 想 情况 下 ， 算 法 不 再 求解 第 一 次 查询 。 然 而 在 许多 情况 下 ， 
由 于 所 研究 的 问题 几乎 没有 变化 ， 因 此 新 查询 与 之 前 的 查询 非常 相似 ， 而 只 是 感 
知 数据 有 一 些微 小 变化 ， 从 而 使 得 约束 查询 中 的 常量 微小 变化 。 图 9. 4 给 出 了 对 
连续 查询 解 的 效用 所 产生 的 影响 。 


Ut 


t 
$ dle ble d yle 


图 9.4 随时 间 变 化 的 查询 解 的 效用 〈 查 询 三 个 e 等 效 的 公式 之 后 是 一 个 新 公式 ) 
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定义 9.3 4AM4 x =x’, p=p H C' 可 通过 用 替换 每 个 常数 上 使 得 
|k-k'|<e 后 由 C 获得 时 ， 认 为 两 个 CSP (h, x, C) A (p, x*',，C') 为 等 
效 。 用 中 | ,表示 与 be 等 效 的 所 有 公式 ， 即 $ 的 邻 域 。 

示例 9.2 ”在 机 器 人 足球 领域 ,执行 行为 的 频率 通常 为 30Hz， 因 为 这 是 机 器 人 
中 最 重要 的 传感器 (摄像头) 频率。 这 些 行为 每 隔 33ms 进行 一 次 查询 。 可 能 会 导致 
相关 约束 满足 问题 显著 变化 的 规划 树 几 乎 变化 。 在 2009 年 的 RoboCup 中 ,平均 每 
3. 5s 变化 一 次 "1。 假设 一 个 机 器 人 自 定位 来 接 传 球 的 任意 球场 景 ， 在 这 种 情况 下 ， 
每 次 迭代 都 需要 进行 描述 目标 位 置 的 约束 查询 。 经 过 几 秒 后 ,裁判 员 示意 比赛 继续 ， 
然后 就 开始 传 球 。 由 于 机 器 人 要 尽快 地 得 到 球 ， 因 此 只 有 这 个 时 候 约束 问题 才 变 化 明 
显 。 一 旦 机 器 人 接 到 球 ， 约 束 问题 再 次 变化 ， 这 次 是 描述 能 够 进 球 得 分 的 位 置 。 

尽管 约束 系统 是 非 线性 的 ， 但 也 可 认为 如 果 p 为 一 个 约束 的 解 ， 则 任何 e 等 
效 的 约束 问题 都 可 在 p 的 邻 域 找到 一 个 解 。 在 此 ， 将 利用 这 种 关系 的 能 力 称 为 
跟踪 。 

跟踪 不 仅 可 极 大 地 减少 求解 查询 的 时 间 ， 而 且 还 可 使 得 解 随时 间 变 化 稳定 ， 
这 是 一 个 非常 重要 的 特性 。 由 于 查询 的 解 通常 用 于 获得 执行 命令 (如 驱动 到 一 
个 约束 位 置 ) ， 因 此 为 平滑 有 效 地 执行 ， 要 求解 应 尽量 稳定 。 即 使 在 感知 数据 具 
有 噪声 的 情况 下 ， 解 也 不 会 随时 间 变 化 而 振荡 。 

动态 约束 满足 问题 ， 即 Brown 和 Migueli 所 深入 讨论 的 随时 间 变 化 的 约束 
问题 ， 他 们 主要 是 考虑 采用 一 种 局 部 修补 的 概念 ， 即 在 之 前 解 的 邻 域内 寻找 一 个 
解 。 另 外 他 们 还 讨论 了 增加 预测 的 可 能 性 ” ， 即 根据 所 记录 的 信息 进行 搜索 。 
然而 上 述 方法 是 针对 离散 约束 系统 ， 而 本 书 主要 是 考虑 连续 约束 系统 。 近 年 来 ， 
Nguyen 和 Yao 研究 利用 遗传 算法 来 解决 动态 连续 约束 优化 问题 ， 他 们 提出 了 
一 种 通过 成 员 吸 纳 可 行 域 之 外 的 个 体 加 入 参考 人 群 的 可 行 域 跟踪 方法 。 该 方法 主 
要 是 针对 遗传 算法 ， 而 很 难 适用 于 其 他 方法 。 

很 多 求解 器 都 能 够 通过 时 间 来 跟踪 解 ， 例 如 可 以 直接 执行 初始 化 一 个 起 始点 
的 局 部 搜索 。 第 一 个 起 始点 就 直接 设 为 之 前 的 解 ， 然 后 理想 情况 下 ， 局 部 搜索 只 
需 几 步 就 能 找到 一 个 解 。 

一 个 SMT 求 解 器 (如 Chaff + Rprop(S,, max)) 还 可 以 下 列 方式 进行 扩展 
来 跟踪 解 

© 缓存 产生 最 后 解 的 命题 模型 以 及 最 后 解 。 下 一 步 ， 检 查 缓存 解释 是 否 也 
是 一 个 模型 。 如 果 是 的 话 ， 则 用 该 模型 以 及 缓存 解 来 求解 非 线性 问题 。 直 观 上 ， 
该 方法 的 优点 在 于 命题 解释 不 随时 间 的 变化 而 变化 ， 因 此 约束 满足 问题 所 产生 的 
行为 可 能 更 加 协调 一 致 。 但 这 是 比较 困难 的 ， 在 某 些 情况 下 ， 若 约束 问题 的 结构 
发 生变 化 ， 则 不 可 能 从 一 个 查询 到 下 一 个 查询 匹配 文本 。 

@ 另外 ， 还 可 缓存 解 ， 并 在 第 一 次 运行 局 部 搜索 时 完全 省 略 SAT 求解 步骤 ， 
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一 旦 搜索 失败 ， 则 只 能 采用 SAT 求解 。 这 虽然 可 避免 公式 结构 变化 的 问题 ,但 
不 能 保证 命题 解释 的 稳定 性 。 

o 最 后 ， 可 缓存 解 ， 对 于 一 个 新 查询 ， 首 先 要 根据 该 解 来 计算 相应 的 一 个 
解释 ， 并 利用 该 解释 来 初始 化 命题 模型 的 局 部 搜索 ， 因 此 就 避免 了 从 不 同 查 询 中 
识别 文本 的 问题 ， 然 后 所 采用 的 局 部 搜索 可 使 得 获得 一 个 模型 所 需 的 变化 最 小 。 
Verfaillie 和 Schiex'' ”提出 了 一 种 称 为 局 部 变化 的 算法 。 

这 样 ， 无 论 是 否 采用 SMT 求解 器 ， 都 只 需 保 存 解 来 实现 跟踪 。 一 个 约束 满足 问 
题 的 所 有 变量 都 可 以 唯一 确定 ， 这 是 因为 这 些 变量 是 规划 变量 或 对 应 于 智能 体 函 数 
流 ， 因 此 通过 缓存 变量 一 值 元 组 可 以 更 好 地 求解 ， 这 样 就 允许 即使 在 某 些 问题 的 维 数 
发 生变 化 时 也 能 跟踪 。 对 于 查询 中 的 每 一 个 新 元 素 〈 即 变量 ) ， 可 对 缓存 的 解 附加 一 
个 随机 值 ， 这 类 似 于 根据 缓存 解 并 选择 一 个 新 的 起 始点 都 无 法 求 得 解 的 情况 。 

由 于 为 使 得 变量 尽 可 能 相关 ， 从 规划 树 的 任何 部 分 都 可 进行 查询 ， 因 此 对 于 
状态 和 规划 类 型 的 绑 定 ， 可 在 最 高 层 上 进行 缓存 。 如 果 适 用 的 话 ，8. 7 节 中 介绍 
的 遍历 构成 一 个 查询 的 规划 树 的 函数 已 经 在 更 高 层 上 代替 了 变量 ， 因 此 利用 CSP 
的 变量 及 其 计算 值 可 直接 进行 缓存 。 

相应 地 扩展 表 9. 1 中 的 算法 也 是 很 简单 的 。 在 首次 运行 局 部 搜索 之 前 ， 不 是 
以 一 个 随机 点 来 初始 化 搜索 ， 则 对 于 约束 问题 中 的 每 个 变量 ， 都 缓存 查询 一 个 
值 。 如 果 没 有 值 ， 即 没有 缓存 ， 则 采用 一 个 随机 值 。 求 得 解 之 后 ， 相 应 的 值 保 存 
在 缓存 中 。9. 5 节 中 ， 将 讨论 如 何 扩展 缓存 的 概念 ， 使 得 在 多 智能 体 领 域 中 可 提 
供 一 定 程 度 的 协调 。 


9.5 协作 


在 pALICA 中 ， 有 关 每 个 规划 中 分 配 的 一 致 信念 已 足以 实现 协调 一 致 的 执 
行 。 但 在 约束 满足 问题 中 ， 已 不 再 是 这 种 情况 。 由 于 是 多 个 智能 体 执行 一 个 规 
划 ， 因 此 每 个 智能 体 应 独立 地 定期 求解 CSP。 因 为 单个 智能 体 的 行为 取决 于 CSP 
的 解 ， 因 此 在 整个 团队 中 这 些 解 应 等 价 或 至 少 相似 ， 使 得 团队 协调 一 致 地 执行 程 
序 。 然 而 由 于 以 下 几 种 原因 ， 会 导致 团队 中 的 解 可 能 存在 偏差 : 

多 解 ” 典 型 的 连续 约束 问题 都 具有 多 个 解 ， 经 常 甚至 是 有 无 穷 多 个 解 。 如 果 
对 一 个 特定 解 没 有 给 定 优先 级 ， 则 智能 体 可 获得 完全 不 同 的 解 。 为 避免 产生 这 种 
问题 ， 可 在 约束 满足 问题 中 增加 一 个 目标 函数 ， 从 而 产生 一 个 约束 优化 问题 。 在 
9.6 节 中 将 详细 讨论 这 一 类 约束 问题 。 然 而 约束 优化 要 比 约束 满足 难得 多 ， 因 此 
非常 需要 一 种 保证 协调 一 致 的 且 计 算 量 较 小 的 其 他 方法 。 

对 称 性 ”存在 多 解 问题 的 一 个 特定 原因 是 对 称 性 。 例 如 ， 如 果 假 设 机 器 人 足 
球场 景 中 的 两 个 机 器 人 a 和 4 用 于 拦截 对 手 c 和 d， 在 没有 任何 限制 条 件 下 ，4a 的 
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结论 可 能 是 a ER c, m oR d, 但 4 的 结论 可 能 是 a 拦截 d， 而 4b 拦截 c。 这 是 
一 个 具体 的 任务 分 配 问 题 ， 只 是 该 问题 集成 到 一 个 CSP 中 。 同 时 ， 利 用 目标 函数 
可 破坏 对 称 性 ， 或 者 优先 选择 一 种 可 实现 协调 一 致 且 代 价 更 小 的 破坏 对 称 性 方法 。 

感知 噪声 ”由 于 感知 信息 具有 了 噪声， 每 个 机 器 人 对 环境 的 观察 少许 不 同 ， 从 
而 导致 团队 中 的 解 集合 也 不 同 。 然 而 除非 智能 体 的 信念 出 现 分 歧 ， 否 则 这 些 集合 
的 交集 为 空 ， 因 此 可 假设 存在 一 个 团队 一 致 认可 的 解 。 如 果 该 解 存在 ， 则 对 于 合 
作 方 法 应 选择 这 样 一 个 解 。 

交叉 CSP 在 ALICA 中 ,每 个 智能 体 都 各 自 具 有 一 个 取决 于 智能 体 所 具有 
的 规划 以 及 所 遍历 的 状态 转移 的 约束 库 ， 而 且 智 能 体 可 以 查询 不 同 变量 。 因 此 尽 
管 团队 中 的 CSP 查询 集合 是 由 某 些 变量 连通 的 ， 但 可 能 在 维 数 和 子 句 上 有 很 大 
不 同 。 若 相应 的 可 行 域 交 叉 比 可 行 域 联合 要 小 得 多 ， 则 很 难 实现 协调 一 致 。 显 
然 ， 如 果 交 叉 为 空 ， 则 无 法 协调 一 致 。 

在 讨论 上 述 情 况 的 可 能 解 之 前 ， 设 定 一 些 约束 满足 问题 之 间 相 互 关系 的 术语 。 

定义 9.4 ”给 定 两 个 CSP ci = (由 X, C) 和 c,= (gq',，X', C')， 认 为 : 

@ MAM4XNX =O, cl 和 cs, 相互 独立 。 

o 当 且 仅 当 对 于 WIRE n 和 c, 的 解 w",， 使 得 (XNX') n= (XNMX') 7 时 ， 
ci 和 c 相互 兼容 。 

e 当 且 仅 当 对 于 c, 的 所 有 解 ， 存 在 c 的 一 个 解 刀 使 得 (XNX') n= (XN 
X') 7' 时 ,cl 包含 c,， 记 为 c1>c,。 

e “HIN c >H e >c 时 ，cj 和 cc 相等。 

一 般 而 言 ， 所 有 独立 的 CSP 都 是 等 效 的 ， 并 且 所 有 独立 可 行 的 CSP 是 相互 
兼容 的 。 而 且 任 何 CSP 都 包含 不 可 行 的 CSP， 如 果 另 一 个 CSP 包含 一 个 可 行 的 
CSP， 则 两 者 兼容 。 

设 C= {(b, %, Ci), +, Cons Xas C,) | 是 智能 体 团队 考虑 的 一 组 CSP。 
处 理 该 集合 的 一 个 简单 方法 以 及 所 引发 的 问题 都 是 构建 交集 @ = (Ap, UX, U 
C,), ， 对 其 集中 求解 并 分 配 解 ， 显 然 每 个 独立 的 CSP 都 包含 交集 。 然 而 这 会 产生 一 
个 瓶颈 ， 至 少 暂 时 是 一 个 单 点 失败 。 而 且 在 动态 环境 中 ， 可 能 导致 在 获得 新 的 感知 
信息 之 前 无 法 与 单个 CSP 及 时 通信 ， 并 且 全 局 CSP 在 求解 之 前 已 失效 。 

或 者 ， 类 似 于 任务 分 配 中 的 pALICA 方法 ， 每 个 智能 体 可 定期 广播 解 ， 然 后 
将 接收 到 的 解 作为 变量 一 值 元 组 集成 到 缓存 中 ， 因 此 缓存 中 就 累积 了 所 有 机 器 人 
计算 的 解 。 根 据 CSP 和 信念 基 ， 这 些 解 可 紧密 地 聚 类 或 分 散在 解 空 间 。 由 于 情 
况 动 态 变 化 ， 一 个 智能 体 不 能 盲目 地 信任 一 个 接收 解 ， 而 是 在 使 用 该 解 之 前 先 检 
查 是 否 与 当前 的 约束 库 相 矛盾 ， 然 而 假设 CSP 在 团队 中 没有 太 大 变化 ， 则 解 可 
能 相近 。 这 意味 着 可 利用 所 接收 的 值 从 求解 的 局 部 搜索 中 推导 初始 点 。 

在 这 些 解 相 差 较 小 的 情况 下 ， 以 每 个 接收 的 解 作 为 一 个 起 始点 会 导致 性 能 降 


第 9 章 约束 问题 求解 131 


低 ， 这 是 因为 可 能 多 次 访问 解 空间 的 同一 区 域 。 另 一 方面 ， 在 这 些 解 分 布 在 整个 
问题 场景 的 情况 下 ， 将 所 有 缓存 值 合并 为 一 个 起 始点 势必 会 过 度 泛 化 ， 因 此 这 些 
解 应 利用 动态 个 数 的 聚 类 来 积聚 。 当 解 比 较 分 散 时 应 采用 许多 初始 点 ， 因 而 团队 
中 的 冲突 程度 较 大 ， 从 而 使 得 每 个 智能 体 评估 团队 的 许多 解 或 全 部 解 ， 并 进行 局 
部 比较 。 在 这 些 解 已 收敛 到 较 小 区 域 时 ， 所 需 的 起 始点 很 少 。 

实现 该 行为 的 聚 类 算法 有 很 多 ， 如 基于 Ward O 研究 工作 的 层次 聚 类 法 ， 或 
Schubert 和 Sidenbladh‘ ”提出 的 结合 贝 叶 斯 滤波 的 有 序 聚 类 。 在 该 情况 下 ， 将 所 
得 的 聚 类 中 心 作 为 局 部 搜索 的 起 始点 ， 因 此 与 算法 的 时 间 效 率 相 比 ， 聚 类 结果 的 
质量 不 太 重要 。 而 且 对 于 所 有 参与 的 智能 体 ， 解 应 该 不 同 。 因 此 在 此 采用 一 种 简 
单 的 基于 距离 的 聚 类 方法 ， 可 产生 大 量 聚 类 中 心 。 然 而 该 效应 只 会 导致 多 次 搜索 
某 个 区 域 ， 而 不 应 显著 降低 整体 性 能 。 

假设 缓存 中 存储 了 每 个 智能 体 和 每 个 变量 的 最 后 接收 值 ， 以 及 本 地 智能 体 的 
最 后 计算 值 。 表 9. 2 给 出 了 一 种 简单 但 快速 的 聚 类 算法 伪 代 码 。 采 用 如 下 的 符号 
约定 : C RRB, Cla, x) 表示 智能 体 a 计算 的 变量 x 的 缓存 值 。 最 后 ， 
Cla,x) = 上 表示 在 缓存 中 不 存在 解 ， 即 a 没有 接收 到 x 的 任何 值 。 


表 9.2 缓存 解 的 聚 类 


InitialPoints (7) { 

//dis the ordered list of queried variables 
Let ř denote the size the domains of v. 

Let 6 bea fixed threshold. i.e., 1073. 

R :一 G: 


Let M bea list containing for all agents a € A: 
= {lv C(a. vaim) )); 
Let M be uniquely ordered according to an ordering over A. 


remove all (L..... L) from M: 


while(M #®) { 


foreach (č € M) { 
d:=0: 
t= 0; 
foreach (i € {1.dim(¥)]) { 
if (cj; F LAs; € 1) { 
d:=d+ a4’, 
t:=t+ 1; 
} 
} 
if (¢=OVd/t < 6) { 
foreach (i € [1.dim(1)]) { 
if (c;) # 1) { 
if (sj = 1) { 
k= l; 
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( 续 ) 


remove ¢ from M; 


} 


} 
if ((As; € 5)s; A L) R := RU {4 (LK. 5) }; 


Sort R descending by first tuple element; 
return œR; 


} 


尽管 所 给 出 的 算法 在 准确 率 上 无 法 与 现 有 的 聚 类 方法 相 比 ， 但 该 算法 计算 速 
度 快 ， 且 足以 使 得 聚 类 点 在 解 空 间 中 相互 接近 ， 而 且 还 可 处 理 部 分 解 ， 即 不 包括 
所 有 查询 变量 的 CSP 的 解 。 当 两 个 智能 体 求 解 交 叉 CSP， 或 一 个 智能 体 通 过 附加 
变量 对 CSP 扩展 时 ， 可 出 现 这 种 情况 。 该 算法 不 能 对 所 处 理 点 的 顺序 进行 交换 ， 
因此 解 矢量 列表 M 的 排列 顺序 是 唯一 的 ， 从 而 使 得 每 个 智能 体 以 相同 顺序 来 处 
理解 。 

运算 结果 是 (RU | 上 上 |) 中 的 一 组 有 序 矢量 集 ， 其 中 上 表示 不 能 从 缓存 中 得 
到 没有 合适 的 值 。 为 获得 局 部 搜索 的 初始 点 ， 这 些 值 应 由 随机 数 代替 。 对 该 集合 排 
序 以 使 得 个 数 较 多 的 聚 类 在 个 数 较 少 的 聚 类 之 前 进行 。 在 一 个 行为 中 的 结果 也 类 似 
于 多 数 表 决 的 方法 ， 即 使 得 每 个 智能 体 优 先 选 择 许多 其 他 智能 体 计算 的 解 。 在 这 种 
聚 类 的 基础 上 ， 可 将 表 9. 1 中 的 局 部 搜索 进行 扩展 ， 产 生 表 9. 3 中 的 算法 。 

该 算法 从 缓存 中 得 到 肾 类 结果 ， 并 根据 这 些 结果 进行 迭代 ， 直 到 在 局 部 搜索 
中 求 得 一 个 解 。 如 果 执 行 完 所 有 的 初始 点 ， 将 继续 以 随机 点 执行 。 一 旦 达到 设 定时 
间 就 终止 该 过 程 ， 这 时 的 解 不 相关 ， 根 据 9.4 节 中 的 实时 性 考虑 ，CSP 认为 这 些 解 
不 可 行 。 然 而 如 果 尚 未 求 得 解 ， 则 该 算法 应 对 第 一 个 缓存 值 运行 一 次 局 部 搜索 ， 并 
根据 随机 点 也 至 少 运行 一 次 局 部 搜索 。 这 样 就 可 保证 能 够 跟踪 最 相关 的 解 〈 即 第 
一 个 解 ) ， 并 且 在 每 个 执行 周期 中 至 少 进行 一 些 尝试 ， 直 到 求 得 一 个 解 。 因 此 为 搜 
索 整 个 解 空间 ， 该 算法 可 避免 由 超时 定义 的 软 实时 约束 。 

由 于 是 对 所 有 聚 类 解 进 行 迭 代 ， 因 此 可 根据 智能 体 的 总 体 排序 来 确定 解 的 优 
先 级 。 该 排序 决定 了 智能 体 的 优先 级 ， 并 原则 上 可 根据 感知 信息 的 质量 与 相关 性 来 
动态 计算 ， 然 而 最 重要 的 是 整个 团队 应 已 知 该 排序 。 在 此 ， 并 不 讨论 如 何 实现 这 种 
动态 排序 ， 而 是 假设 一 种 简单 的 静态 排序 〈 如 根据 唯一 的 标识 ) 。 

该 算法 可 解决 10. 3 节 中 所 述 的 对 称 解 、 多 解 以 及 抗 噪 问题 。 而 且 还 可 利用 
团队 的 分 布 式 计算 功能 来 求解 ， 从 而 有 效 地 解决 了 无 法 在 一 个 周期 内 分 布 式 求解 
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CSP 难题 的 问题 。 这 种 情况 下 ， 智 能 体 利用 随机 起 始点 搜索 整个 空间 ， 直 到 一 个 
智能 体 找到 一 个 可 行 解 ， 然 后 分 布 该 可 行 解 。 


表 9.3 通过 缓存 进行 协调 的 局 部 搜索 


Solve(csp) { 
// parameters: sinit = 1073, inc = 1.2, dec = 0.5 
/ minV = 107!?, maxv = 10!” 
begin := now; 
f :=transform(csp); // transform the problem into a function 
let p™" and p™* be the vectors of the lower (upper) bounds, respectively; 
d := number of dimensions of the csp; 
isl, 
M := InitialPoints (vars(csp)): 
while(true) { 
pHi : 
if (i< |M|) { 
p := Mi; 
} 
foreach (p; € p) { 
if (pj = 1) 
pi := random value € |p". 


en li 


p 


let s and h be vectors with d elements: 
set all sx := Sini (PP™ — pm"); 
set all hg := 0; 
while(++j < maxlterations ) { 
if (f(p) > 0) { 
insert p into cache; 
return p; 
} 
8:= Vf(p); 
for (k=0; k<d; k++) { 
if (gp hy > 0) Sk := Sk inc: 
if (gq hy < 0) Sk := Sk dec; 
Sk := min(max (sg, minV), maxV); 
Pk := Pk +SEN(8k) Sk: 
pk := min(max (pp. pe"). PR”) 
} 
h =g; 
} 
if (time since begin > timeout) { 
if (i = 1) 7 := |Ml+1; //do at least one free exploration 
else return FAILURE; 


但 是 该 算法 不 能 解决 交叉 .CSP 的 问题 ， 尽 管 该 算法 可 处 理 具 有 不 同 但 交叉 
的 变量 集 的 CSP 问题 ,但 在 可 行 域 不 同时 ， 并 不 能 保证 团队 收敛 。 这 是 一 个 不 
能 轻易 解决 (否则 该 CSP 问题 就 易于 处 理 ) 的 难题 。 也 就 是 说 ， 如 果 存 在 一 个 
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解决 交叉 CSP 问题 的 方法 ， 这 比 通过 构建 交叉 并 局 部 求解 要 更 加 有 效 ， 也 比 本 
身 是 一 个 高 效 求解 器 的 方法 更 有 效 。 

显而易见 ， 在 给 定 通信 延迟 、 非 线性 且 求 解 器 不 完备 性 的 条 件 下 ， 没 有 一 种 
不 牺牲 反应 能 力 的 更 好 方法 。 由 于 不 完备 性 ， 求 解 器 不 能 推导 一 个 CSP 的 不 可 行 
性 ， 基 本 上 只 能 测试 一 个 给 定 赋值 是 否 构 成 一 个 解 。 男 外 在 未 知 CSP 且 没 有 局 部 
测试 点 或 查询 其 他 机 器 人 的 情况 下 ， 一 个 智能 体 无 法 知道 一 个 解释 是 否 是 另 一 个 智 
能 体 认为 有 效 的 CSP 的 一 个 解 。 由 于 延迟 而 导致 查询 需要 花费 大 量 时 间 ， 同 时 也 
会 造成 问题 发 生变 化 的 可 能 。 男 一 方面 ， 如 果 查 询 智能 体 已 知 CSP， 这 样 就 可 解决 
两 个 CSP 的 交叉 问题 。 这 比分 别 考虑 两 个 CSP 更 有 效 ， 否 则 就 应 通过 问题 分 解 来 
构建 一 个 更 好 的 求解 器 。 值 得 注意 的 是 ， 如 果 假 设 相对 于 环境 的 动态 变化 ， 通 信 延 
迟 较 小 ， 则 这 些 消息 可 用 于 实现 Petcu' 所 提出 的 分 布 式 求解 与 优化 技术 。 

针对 这 种 类 型 的 协调 合作 问题 ， 另 一 种 方法 是 通过 监视 缓存 来 检测 由 交叉 
CSP 产生 的 一 个 持续 冲突 ， 并 且 一 旦 发 生 冲 突 ， 就 将 决策 协议 切换 到 另 一 种 以 
牺牲 一 定 程 度 的 反应 能 力 来 解决 冲突 的 协议 。 例 如 ， 可 指定 一 个 智能 体 来 构建 
交叉 ， 求 解 后 并 广播 解 ， 这 类 似 于 第 6 章 中 介绍 的 局 部 领导 者 协议 。 或 者 ， 可 
假设 每 个 智能 体 对 部 分 CSP 进行 显 式 控 制 ， 并 在 团队 中 交换 解 ， 这 类 似 于 参 
考 文献 [121] 中 的 DCOP 方 法 。 在 此 ， 将 这 种 处 理 交 叉 CSP 的 方法 作为 今后 
的 研究 工作 。 


9.6 约束 优化 


在 前 面 的 章节 中 ， 主 要 考虑 了 约束 满足 问题 ， 其 中 智能 体 行为 取决 于 这 些 
CSP 的 解 集合 。 然 而 在 许多 场景 中 ， 可 能 不 仅 要 描述 一 组 解 ， 还 要 根据 某 种 准则 
选择 其 中 的 最 优 解 。 尽 管 这 仍 可 以 看 作 一 个 允许 量化 的 约束 满足 问题 ， 但 作为 约 
束 优化 问题 的 一 个 公式 往往 更 容易 求解 。 

布尔 域 的 量化 CSP (QCSP) 是 PSPACE 完备 的 2 。 据 我 们 所 知 ， 目 前 还 没 
有 一 种 算法 能 有 效 处 理 连续 域 的 QCSP， 以 用 于 动态 域 中 运行 的 智能 体 团队 ， 尤 
其 是 存在 非 线 性 函数 和 超越 函数 时 。 目 前 ， 针 对 连续 域 QCSP 求解 器 的 研究 工作 
主要 是 由 Goldsztejn 等 人 1%' 引 进行 研究 。 

在 此 ， 并 不 按照 QCSP 的 思路 ， 而 是 设 定 一 个 优化 准则 并 结合 CSP 来 产生 一 
个 约束 优化 问题 (COP) 。 

定义 9.5 ”如 果 P= (x, b, C) 为 一 个 CSP, fH x 到 RR 域 的 一 个 函数 映射 
mir, 则 P'= (P, f) 是 一 个 COP。P 的 任 一 解 ; 也 是 P' 的 解 。P' 的 一 个 最 优 
解 也 是 P 的 一 个 解 ， 使 得 所 有 P 的 解 ;' 存 在 f(s) 三 f(s')。f 称 为 目标 函数 。 

在 此 ， 只 是 针对 单个 目标 函数 的 情况 ， 因 此 该 定义 不 包括 多 目标 的 优化 。 
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扩展 表 9. 1 的 局 部 搜索 方法 来 处 理 优化 问题 是 非常 简单 的 。 本 质 上 ， 该 算法 
在 确定 一 个 可 行 域 之 后 并 不 是 立刻 终止 ， 而 是 跟踪 可 行 域内 目标 函数 的 梯度 。 缺 
点 是 对 于 一 个 单纯 的 约束 满足 问题 ， 不 能 产生 一 个 合适 的 终止 条 件 准则 。 实 际 
上 ， 如 果 没有 限定 目标 函数 位 于 搜索 空间 ， 则 由 于 自身 的 不 完备 性 ， 该 算法 不 能 
保证 一 定 可 求 得 一 个 全 局 最 优 解 。 

然而 对 于 许多 约束 问题 ， 目 标 函 数 的 上 限 是 事先 已 知 的 ， 或 通过 区 间 传 播 可 
计算 得 到 。 另 外 在 许多 场景 下 并 不 需要 得 到 一 个 最 优 解 ， 而 只 需 得 到 一 个 足够 接 
近 的 解 就 可 接受 ， 尤 其 是 在 给 定 严格 实时 性 约束 的 条 件 下 。 因 此 假设 对 于 任意 目 
标 函数 /， 都 存在 一 个 表示 充分 性 阔 值 的 人.， 使 得 对 于 目标 函数 为 了 的 任意 
COP， 一 个 使 得 /(*) >/, 的 解 * 表示 这 是 一 个 足够 接近 最 优 解 的 解 ， 这 时 可 终 
止 搜索 。 当 然 六 .也 可 能 等 于 wm ， 这 时 只 有 达到 超时 才 会 终止 搜索 。 

示例 9.3 ”对 于 一 个 约束 个 机 器 人 目标 位 置 的 CSP， 一 个 合适 的 目标 函数 应 
使 得 机 器 人 当前 位 置 与 其 目标 位 置 的 平方 距离 和 : KZ) =- E” Dist(Goal(é) , 
Pos (i) ) 最 小 。 

这 样 就 可 使 得 机 器 人 需要 运行 的 距离 最 短 ， 从 而 更 快 地 达到 目标 状态 。 由 于 
任意 两 点 之 间 的 最 短 距离 为 0， 则 f(x) 的 全 局 最 优 也 为 0， 尽 管 机 器 人 已 达到 可 
行 位 置 ， 但 只 有 该 点 才 有 效 。 另 外 由 于 感知 噪声 以 及 执行 机 构 的 准确 性 限制 ， 机 器 
人 不 能 非常 精确 地 自 定位 ， 因 此 应 根据 域 选择 一 个 限制 范围 ， 如 /= -0. In. 

由 于 相对 于 目标 值 ， 不 同 初 始点 获得 的 解 应 能 够 相互 比较 ， 因 此 最 优化 还 需 
要 交换 解 或 缓存 解 的 一 个 稍微 复杂 的 处 理 。 交 换 解 允 许 团队 分 布 式 地 搜索 整个 空 
间 ， 与 单个 智能 体 相 比 ， 这 能 够 更 快 地 获得 最 优 解 或 近似 最 优 解 。 

这 样 ， 一 个 智能 体 就 应 选择 一 个 与 最 佳 目标 函数 值 相 适 应 的 解 。 然 而 为 使 得 
该 解 不 随时 间 变 化 且 在 团队 中 稳定 ， 应 在 一 定 程度 上 优先 选择 较 早 计算 的 解 或 其 
他 多 个 智能 体 计算 的 解 。 在 约束 满足 问题 中 ， 这 可 通过 聚 类 解 的 优先 级 排序 来 实 
现 。 在 此 引入 两 个 最 优 准则 ， 即 给 定 的 目标 函数 ， 以 及 随时 间 变化 和 在 团队 中 的 
一 致 性 。 由 于 域 的 动态 性 ， 这 两 个 准则 可 能 存在 冲突 。 

可 采用 下 列 方 式 来 处 理 冲 突 问题 : 

o 首先 ， 优 先 选择 最 佳 目标 函数 值 ， 从 而 允许 高 度 反应 性 的 行为 . 

© 其 次 ， 以 一 个 不 同 参数 集 ( 即 最 小 步 长 更 小 ， 和 迭代 次 数 更 多 ) 来 执行 首次 运 
行 的 由 表决 个 数 最 多 的 又 类 中 心 初始 化 的 局 部 求解 器 ， 这 可 增 大 跟踪 一 个 最 优 解 的 
概率 。 

o 第 三 ， 首 次 运行 求解 器 得 到 的 解 具有 较 高 的 优先 级 ， 从 而 使 得 其 他 解 必 
须 至 少 在 一 定 程度 上 优 于 首次 运行 的 解 。 该 种 假设 可 有 效 抑制 振荡 。 

e 最 后 ， 在 存在 一 个 目标 函数 的 条 件 下 ， 一 旦 优化 了 一 个 非 约束 问题 ， 则 
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所 得 到 的 解释 可 作为 约束 问题 的 初始 点 ， 因 此 该 算法 只 搜索 目标 函数 最 优 解 附近 
的 可 行 域 。 

这 些 措 施 可 有 效 避 免 求解 一 个 大 时 变 多 目标 优化 问题 的 并 发 性 ， 并 允许 在 目 
标 场景 变化 的 情况 下 快速 反应 。 在 10. 3 节 将 对 该 技术 进行 评估 。 

表 9.4 给 出 了 完整 算法 ， 内 部 的 优化 循环 见 表 9. 5。 值 得 注意 的 是 ， 其 中 精 
确 搜 索 以 及 不 太 精 确 搜 索 的 参数 都 是 临时 选择 的 示例 值 。 非 约束 问题 的 单 次 优化 
运行 值得 商 椎 ， 这 是 因为 这 可 改善 或 和 减损 (参见 参考 文献 [180] 中 关于 该 问 
题 的 讨论 )。 然 而 这 可 保证 在 每 次 迭代 中 ， 时 间 约 束 人 允许 条 件 下 可 搜索 目标 函数 
值 较 高 的 区 域 。 在 此 ， 认 为 这 对 整个 约束 问题 的 求解 是 有 利 的 。 


表 9.4 最 优化 和 协调 的 局 部 搜索 


Solve( satisfaction problem csp, objective function o, objective threshold 0o,){ 
// parameters: significance threshold s, = 107? 

begin := now; 

f :=transform(csp); //transform the problem into a function 

let p™" and p™* be the vectors of the lower (upper) bounds, respectively; 

d := number of dimensions of the csp; 


M := InitialPoints (vars(csp)): 
Poest := FAILURE; 
while( true) { 
Pp ,一 
if (i< |M|) { 
p := M; 
} 
foreach ( p; € p) { 
if (pi =L) 


pi := random value € [PP pm™]; 


1 
} 
if (time since begin < timeout Ai = |M|+1){//do one unconstrained optimisation 
p := Rprop(p,l,o,L); 
} 
p := Rprop(p,f.o, i=l); 
if (p A FAILURE A (Pyes = FAILURE V o(p) > O( Ppest) +57) { 
Pbest -= P; 
if (ois constant Volpbest) > a) { 
insert Ppest into cache; 
return Ppest 
} 
} 
if (time since begin > timeout) { 
if (i < IMI+ 1) 7 := IMI+1; //do at least one free exploration 
else { 
insert Pbest into cache; 
return Ppest 3 
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Rprop(p,c,o, precise ) { 
//arguments: p — the initial point, c — the transformed csp, o — the objective function , 
// precise — indicating which parameter set should be used 
// parameters: inc=1.2, dec=0.5, sinit = 107°, maxV = 10!” 
if ( precise ) { 
maxIterations := 110, minV := 10~'5 
} else { 
maxIterations := 60, minV := 107"! 
} 
let p™" and p™* be the vectors of the lower (upper) bounds, respectively: 
d := number of dimensions of the csp: 
let s and h be vectors with d elements; 
set all sq i= Sim (PP — pi"); 
set all hy := 0; 
Phest := P; 
fi = 0; 
while(++/ < maxlterations ) { 
if(c(p) <0) { 
8 :=Ve(p); 
} 
else { 
if (o is constant) return p; 
8 := Vo(p); 
if (c(pbest) < 0Vo(p) > O(Prest )) 
Poest = Ps 


min 


} 
for(k:=0; k<d; k++) { 
if (gx hy > 0) Sk := Sk inc; 
if (gx :hx < 0) sx := Sk- dec; 
Sk := min(max (sp, minV). maxV); 
Pk := Pk t+sgn(gx) Sk; 


pk := min(max (px. pei"). pr): 


} 
h:= g; 
} 


} 
if (c(pbest ) < 0) return FAILURE; 
return Pbest; 


} 


尽管 对 基于 SMT 的 方法 进行 扩展 以 解决 优化 问题 已 超出 本 书 的 范畴 ， 但 在 
这 里 还 是 要 讨论 一 下 处 理 优化 问题 的 可 能 性 。 首 先 ， 一 个 SMT 求解 器 可 在 所 有 
命题 模型 中 迭代 ， 并 比较 所 得 的 解 。 随 着 模型 个 数 的 增加 ， 该 求解 器 很 快 就 不 可 
行 。 其 次 ， 一 个 非 约束 目 标 函 数 的 最 优 解 可 用 于 计算 作为 在 命题 邻 域内 迭代 进行 
局 部 搜索 的 起 始点 的 一 个 命题 分 配 。 最 后 ， 只 要 求 得 一 个 解 ， 即 可 利用 分 支 定 界 
方法 5 通过 迭代 确定 附加 约束 来 缩小 命题 搜索 空间 。 
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9.7 约束 与 任务 分 配 


ALICA 中 CSP 和 COP 均 人 允许 以 一 种 简洁 的 方式 来 制定 功能 强大 的 一 阶 决策 ， 
”而 且 还 可 有 效 求解 该 决策 。 然 而 在 规划 执行 期 间 ， 智 能 体面 临 两 个 独立 而 交错 的 
问题 ， 即 找到 查询 变量 的 一 个 赋值 ， 并 找到 一 个 智能 体 与 任务 相关 联 的 任务 分 
配 。 这 些 解 对 智能 体 的 行为 有 着 主要 影响 。 通 常 CSP 是 指 分 配给 特定 任务 的 智 
能 体 的 动态 特性 ， 如 在 环境 中 的 位 置 、 续 航 能 力 或 某 些 关节 的 当前 配置 。 因 此 ， 
任务 分 配 会 影响 一 个 CSP 的 可 行 域 ， 并 对 一 个 COP 的 最 优 解 有 影响 。 这 些 关 系 
是 由 展开 步骤 〈( 见 定义 8.8) 决定 的 。 

理想 情况 下 ， 这 两 个 问题 可 统一 。 所 产生 的 问题 描述 将 使 得 取决 于 每 个 智能 
体 的 任务 以 及 一 组 连续 变量 的 目标 函数 最 大 化 ， 从 而 满足 一 个 布尔 组 合 的 约束 。 

处 理 这 两 个 问题 的 一 种 简单 方法 是 : 在 所 有 基数 允许 的 任务 分 配 中 进行 迭 
代 ， 在 所 有 满足 CSP 的 任务 分 配 中 ， 选 择 效 用 最 高 的 ， 然 而 该 方法 由 于 运算 量 
过 大 而 很 快 不 可 行 。 男 外 如 果 利 用 现 有 方法 在 首次 迭代 中 没有 求 得 全 局 最 优 解 ， 
则 可 在 降低 团队 性 能 的 基础 上 ， 从 该 方法 中 选择 一 种 计算 速度 较 快 的 任务 重 
分 配 。 

原则 上 ， 该 问题 可 看 作 一 个 混合 整数 的 非 线 性 约束 规划 问题 。 近 年 来 Nema 
等 人 ”不 断 改 进 处 理 该 问题 的 技术 。 然 而 确定 一 种 适用 于 该 问题 的 合适 求解 器 
仍 是 今后 的 主要 研究 内 容 ， 要 求 该 求解 器 能 够 在 严格 时 间 约 束 条 件 下 有 效 执行 
(如 求解 标准 情况 下 的 约束 问题 不 超过 30ms) 。Nema' ”的 经 验 结果 表明 这 些 求 
解 器 并 不 适用 于 这 种 软 实 时 场景 。 

可 以 交错 执行 任务 分 配 的 4 搜索 和 约束 求解 ， 以 使 得 搜索 树 的 大 部 分 都 可 
能 被 提前 裁剪 。 但 从 另 一 个 角度 来 看 ， 这 两 个 核心 问题 的 统一 存在 一 个 主要 缺 
点 。5. 12 节 中 介绍 的 任务 分 配 算法 是 合理 且 完 备 的 。 该 算法 与 一 种 如 求解 非 线 
性 约束 满足 问题 的 局 部 搜索 的 不 完备 算法 相 结合 ， 可 导致 一 种 不 完备 的 任务 分 
配 ， 这 是 非常 不 希望 出 现 的 。 

只 要 最 有 效 的 任务 分 配 产生 一 个 可 行 的 COP， 使 得 其 全 局 最 优 解 至 少 与 其 
他 有 效 任务 分 配 产生 的 所 有 COP 的 全 局 最 优 解 同 样 好 ， 则 任务 分 配 和 约束 优化 
的 不 相交 处 理 可 产生 一 种 最 优 解 。 目 前 ， 这 种 特性 只 能 通过 仔细 设 定 运行 时 条 件 
和 效用 函数 来 实现 。 


9.8 ”本章 小 结 


本 章 介绍 了 一 种 可 随时 求解 很 多 类 约束 问题 的 求解 器 ， 即 连续 域 中 具有 有 理 
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函数 和 超越 函数 的 非 线性 约束 的 布尔 组 合 。 我 们 认为 该 类 问题 适用 于 多 机 器 人 领 
域 发 生 的 各 种 不 同 问题 。 基 于 结合 局 部 搜索 和 自动 微分 的 求解 器 可 提供 线性 时 间 
内 每 个 点 的 梯度 。 阐 述 了 如 何 利用 缓存 跟踪 时 变 解 ， 并 通过 集成 一 种 聚 类 算法 将 
该 缓存 方法 扩展 为 一 种 协调 方法 ， 对 所 有 可 能 解 进 行 多 数 表决 。 之 后 讨论 了 约束 
优化 问题 的 相关 性 ， 并 随后 对 算法 进行 扩展 来 处 理 该 问题 类 。 在 第 7 章 中 所 讨论 
的 参考 实现 集成 了 该 求解 器 ， 而 且 还 在 基于 动机 基准 测试 的 场景 中 讨论 了 SMT 
求解 技术 的 潜力 。 最 后 从 统一 的 角度 出 发 ， 确 定 任务 分 配 和 CSP 求解 为 两 个 相 
关 问 题 。 


第 4 部 分 评估 


第 10 章 iF f 


在 前 面 的 章节 中 ， 介 绍 了 一 种 多 机 器 人 编程 语言 ALICA。 首 先 在 第 2 部 分 中 
从 一 个 基本 的 命题 式 变量 开始 ， 接 着 在 第 3 部 分 ， 对 此 在 连续 值 约束 下 进行 扩 
展 。 在 此 重新 讨论 第 1 章 中 所 述 的 设计 目标 ， 并 给 出 相应 的 评估 结果 。 

首先 ,在 10. 1 节 中 ,介绍 了 Carpe Noctem 团队 在 利用 之 前 所 介绍 的 方法 进 
行 团队 行为 建 模 时 所 积累 的 经 验 。 根 据 这 些 经 验 所 产生 的 某 些 设计 模式 已 被 证 明 
具有 较 好 的 鲁 棒 性 和 可 重用 性 。10. 2 节 主 要 讨论 了 非 可 靠 网 络 条 件 下 的 鲁 棒 性 ， 
并 给 出 了 在 机 器 人 足球 领域 中 具有 不 同 程度 的 丢 包 和 包 延 迟 情 况 下 的 仿真 结果 。 
同时 ， 还 表明 了 在 这 些 条 件 下 进行 冲突 检验 和 冲突 消解 的 效果 。 在 10.3 节 中 ， 
对 约束 求解 和 优化 技术 的 鲁 棒 性 进行 了 评估 。 主 要 评估 了 随时 间 变 化 的 噪声 以 及 
智能 体 团 队 在 不 同 程度 的 感知 噪声 下 求解 约束 问题 的 协调 一 致 性 。10. 4 节 描 述 
了 如 何在 外 太空 搜救 的 场景 中 应 用 ALICA。 此 外 ， 还 介绍 了 一 种 多 机 器 人 协作 探 
索 某 一 区 域 的 动态 编队 方法 。 最 后 ， 在 10.5 节 ， 将 ALICA 应 用 于 一 个 搜救 领域 
的 场景 。 主 要 是 利用 ALICA 来 协调 和 控制 一 个 消防 队 ， 以 应 对 城市 中 的 多 处 灭 
火 任 务 。 将 ALICA 与 一 组 任务 分 配 问题 的 处 理 方法 进行 性 能 对 比 ， 并 对 ALICA 
在 所 参与 的 智能 体 个 数 方面 的 可 扩展 性 进行 了 评估 。 


10.1 机 器 人 足球 建 模 


自 2009 年 ，Kassel 大 学 的 Carpe Noctem 机 器 人 足球 团队 已 成 功 应 用 了 ALI- 
CAS 。 这 使 得 开发 人 员 在 应 用 ALICA 实现 规划 和 策略 方面 积累 了 宝贵 经 验 。 这 些 
经 验 最 终 应 用 于 具体 的 设计 模式 ， 证 明 在 存在 噪声 、 非 可 靠 性 通信 以 及 机 器 人 损坏 
等 情况 的 某 些 领域 中 具有 高 效 、 可 重用 性 和 重 棒 性 等 特点 。 同 时 也 阐述 了 ALICA 
的 表现 性 。 接 下 来 ， 由 于 特定 域 描 述 并 非 本 书 内 容 的 一 部 分 ， 且 更 加 正式 的 表示 方 
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法 并 不 能 对 示例 有 多 大 帮助 ， 因 此 在 此 用 一 种 伪 正 规 方式 来 描述 特定 域 公式 。 
10.1.1 强 同 步 与 弱 同 步 

如 5. 13 节 所 述 ，ALICA 可 通过 采用 显 式 语言 元 素来 实现 强 同 步 ， 或 利用 机 器 
人 的 信念 条 件 来 实现 弱 同 步 。 图 10. 1 给 出 了 采用 一 个 同步 元 素来 实现 强 同步 的 情 
况 ， 使 得 智能 体 只 能 分 别 从 状态 za 到 状态 过 以 及 从 状态 zi 到 状态 za 来 共同 运动 。 若 
智能 体 之 间 的 共同 信念 是 必须 满足 $8, 和 4,， 则 智能 体 只 能 按照 上 述 状态 转移 进行 


运动 。 


图 10.1 ALICA 中 的 强 同 步 


由 于 通信 开销 过 大 ， 因 此 在 RoboCup 中 很 少 采 用 强 同步 。 与 此 同时 ， 却 经 
常 采 用 弱 同步 ( 如 描述 一 个 传 球 时 )。 图 10.2 描述 了 一 个 类 似 的 模式 。 在 此 ， 
执行 任务 1 的 智能 体 首先 根据 状态 转移 运动 ， 而 在 该 智能 体 达 到 状态 2 之 前 ， 执 
行 任务 2 的 智能 体 一 直 保持 等 待 。 这 种 协同 工作 只 需 一 条 消息 。 另 一 方面 ， 由 于 
第 二 个 机 器 人 始终 是 在 第 一 个 机 器 人 运动 完成 后 才 运 动 的 ， 因 此 并 没有 实现 真正 
的 同步 状态 转移 。 这 在 许多 场合 中 都 是 可 接受 的 。 同 时 ， 弱 同步 会 更 容易 出 错 ， 
例如 在 第 二 个 智能 体 没 有 接收 到 来 自 于 第 一 个 智能 体 的 规划 树 消息 的 情况 下 。 
ALICA 中 所 采用 的 定期 广播 可 在 某 种 程度 上 缓解 该 问题 的 发 生 。 
10.1.2 ”有限 状态 机 与 动态 任务 分 配 

ALICA 建 模 语义 的 核心 是 三 个 相互 对 立 的 概念 ， 即 有 限 状 态 机 、 动 态 任务 
分 配 和 约束 满足 与 优化 问题 。 从 建 模 角 度 来 看 ， 任 意 组 合 这 三 个 概念 的 能 力 是 
ALICA 的 一 个 优势 。 图 10. 3 描述 了 仅 利 用 动态 重 分 配 来 制定 的 一 个 RoboCup R 
略 。 相 应 的 效用 函数 U(121play) 可 使 得 进攻 队员 与 球 之 间 的 距离 以 及 防守 队员 
与 己方 球门 之 间 的 距离 最 小 化 ， 因 此 执行 防守 任务 的 优先 级 要 高 于 执行 助攻 任 
务 。 相 比 之 下 ， 图 10. 4 中 所 描述 的 进攻 规划 是 一 个 纯粹 的 有 限 状态 机 。 在 给 定 


10.2 ALICA 中 的 弱 同 步 


球 和 对 手感 知 位 置 的 条 件 下 ， 该 规划 
控制 着 机 器 人 的 动作 。 [piw 

上 述 两 个 示例 表明 了 如 何 将 有 限 
状态 机 和 动态 任务 分 配 这 两 个 概念 在 
同一 个 ALICA 程序 中 成 功 地 结合 应 
用 。 同 时 这 两 个 概念 甚至 还 可 以 在 同 
一 个 规划 中 结合 应 用 ， 如 图 10.5 所 
示 。 图 中 ， 两 个 机 器 人 位 于 控 球 机 器 
人 的 附近 ， 以 防止 对 方 防守 队员 接近 。 
根据 场 上 信息 ， 任 务 分 配 算法 动态 地 
对 智能 体 分 配 这 三 个 任务 ， 而 状态 转 
移 则 使 得 保护 机 器 人 在 跟随 状态 和 拦 
截 状态 之 间 切 换 。 
10.1.3 选择 与 执行 

有 限 状态 机 、 动 态 分配 和 决策 相 图 10.3 RoboCup 中 的 1-2-1 策略 
结合 可 产生 另 一 种 设计 模式 ， 通 常 称 
之 为 “选择 和 执行 ” 。 在 此 ， 团 队 执行 一 个 规划 类 型 并 动态 切换 执行 规划 ， 直 到 
满足 某 一 条 件 ， 然 后 团队 根据 当时 执行 的 规划 类 型 转移 到 一 个 所 选 的 状态 ， 从 而 
在 条 件 为 真 时 进行 动态 决策 。 在 图 10.6 中 利用 在 机 器 人 足球 中 掷 界外 球 的 一 个 
ALICA 规范 来 描述 上 述 情况 。 

在 掷 界 外 球 规 划 中 ， 对 一 个 机 器 人 分 配 守门 员 任务 ， 而 其 他 机 器 人 执行 
FieldPlay 任务 。 守 门 员 独 立地 防守 球门 ， 其 余 场 上 队员 既 可 以 在 状态 PH A 
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进攻 规划 


~Near(Ball, Opponent) V "HaveBall 


~HaveBall 


图 10.4 进攻 机 器 人 的 RoboCup 规划 


31Play 


110.5 RoboCup 中 的 3-1 策略 


的 位 置 运 动 ， 也 可 以 在 状态 2 下 搜索 位 置 未 知 的 足球 。 在 这 种 简单 的 示例 情况 
下 ， 掷 界外 球 位 置 规划 类 型 中 包含 四 种 不 同 的 规划 ， 每 种 规划 都 代表 着 一 种 不 同 
的 情况 。 团 队 根 据 足 球 位 置 、 对 手 行为 以 及 当前 比赛 得 分 情况 来 选择 其 中 的 一 种 
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10.6 RoboCup 中 掷 界 外 球 的 规划 


规划 。 只 要 比赛 处 于 这 种 定位 阶段 ， 团 队 便 可 在 这 些 规划 中 动态 地 切换 。 条 件 ， 
hi ~ 由 均 具 有 以 下 形式 : 

Situation(Start) A ((Va, x, y) In(a, ThrowIn, FieldPlay, z,) <*In (a, 
Pis %*, ¥)) 
AP pp, FB FRAP ERA ENRE h A — 7S BL o 

这 样 一 旦 接收 到 裁判 员 的 比赛 开始 信号 ， 同 时 团队 成 员 之 间 达 成 共识 ， 则 团 
队 就 会 转移 到 由 当前 执行 规划 决定 的 下 一 个 状态 。 如 果 已 知 产生 了 一 个 冲突 ， 则 
首先 解决 该 冲突 ， 然 后 场 上 队员 再 进入 执行 阶段 。 值 得 注意 的 是 ， 由 于 条 件 是 在 
机 器 人 发 生 状态 转移 时 变化 ， 因 此 这 种 结构 并 不 与 局 部 性 原理 相 冲 突 。 前 置 条 件 
中 的 一 个 类 似 结 构 将 会 违背 规划 的 局 部 性 原理 。 

本 节 所 给 出 的 示例 表明 了 在 ALCA 中 建 模 的 方便 性 及 其 出 色 的 表现 性 。 赁 
{ff RoboCup 机 器 人 团队 所 积累 的 经 验 ， 将 逐渐 出 现 一 些 类 似 于 编程 语言 中 模式 
的 设计 模式 。 


10.2 非 可 靠 性 通信 


在 参考 文献 [157] 中 首次 给 出 了 在 没有 冲突 检验 和 冲突 消解 的 情况 下 对 
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pALICA 的 评估 结果 ， 着 重 关注 在 网 络 条 件 较 差 情况 下 的 性 能 。 结 果 表 明 在 网 络 
条 件 较 差 情 况 下 〈 如 丢 包 率 的 均匀 分 布 达 到 50% ， 包 延迟 达到 600ms) ， 性 能 仍 
然 表 现 稳 定 。 包 延迟 的 仿真 结果 在 2009 年 RoboCup 世界 冠军 赛 的 真实 环境 条 件 
下 得 到 了 验证 "” 。 

自 此 以 后 ，ALICA 架构 中 的 主要 变化 之 一 是 增加 了 显 式 冲突 检验 和 冲突 消 
解 。 在 参考 文献 [158] 中 首次 介绍 了 ALICA 中 的 冲突 检验 和 冲突 消解 ， 并 于 
2011 年 初 在 Carpe Noctem RoboCup 团队 中 开始 得 到 应 用 。 表 明 由 于 静态 误差 
〈 即 配置 不 一 致 ) 而 导致 的 冲突 ， 能 够 可 靠 地 检测 并 利用 第 6 章 所 介绍 的 冲突 消 
解 机 制 来 解决 。 此 外 ， 该 方法 还 可 补偿 由 系统 感知 误差 (如 机 器 人 对 与 被 感知 
物体 之 间 的 距离 估计 不 足 ) 产生 的 冲突 。 

接 下 来 ， 在 此 给 出 非 可 靠 性 通信 条 件 下 有 /无 冲突 消解 时 对 ALICA 性 能 的 评 
佑 结果 。 在 每 个 实验 中 ， 四 个 足球 机 器 人 在 不 同 的 网 络 条 件 下 模拟 运行 Smin， 
然后 测量 从 触发 动态 重 分 配 的 某 个 事件 到 团队 对 该 任务 分 配 达 成 一 致 所 需 的 时 
间 。 该 时 间 称 为 协调 时 间 (TTC)。 这 种 测量 方法 类 似 于 Kaminka 和 Tambe ”所 
提出 的 ATA (平均 协商 时 间 )。 然 而 ATA 以 每 次 模拟 仿真 所 用 的 抽象 时 间 单 位 
“ticks” 进 行 测量 ,该 时 间 单 位 同时 也 用 于 同步 机 器 人 的 审议 周期 。TTC 以 秒 为 
单位 。 此 外 ， 在 仿真 过 程 中 没有 人 为 地 同步 机 器 人 的 行为 或 感知 信息 。 

除 此 之 外 ， 还 测量 了 团队 中 不 同 信念 状态 的 平均 数 ， 称 之 为 信念 计数 值 
(BC) ， 其 范围 为 1 (完全 同意 ) 4 〈 每 个 智能 体 都 有 不 同 的 观点 ) 。 该 测量 值 反 
映 了 团队 中 信念 不 一 致 的 程度 。 环 境 的 动态 性 越 高 ， 信 念 计数 平均 值 则 越 大 ， 这 
是 由 于 智能 体 不 能 在 决策 之 前 快速 达成 共识 ， 另 外 有 关 环境 中 动态 变化 元 素 的 感 
知 信 息 还 应 传递 给 无 法 直接 观察 该 元 素 的 智能 体 。 在 机 器 人 足球 中 ， 这 些 元 素 包 
插足 球 、 对 手 以 及 团队 成 员 的 位 置 。 

在 接 下 来 的 实验 中 ,每 个 智能 体 的 审议 频率 设 为 30H;， 最 大 通信 频率 
(fx) 为 15 Hz， 最 小 通信 频率 (San) AS Hz。 对 于 具有 冲突 消解 的 实验 ， 触 
发 冲突 消解 的 周期 个 数 设 为 4， 权 威 时 间 间 隔 的 范围 为 4, =0.8s 到 tw =5s 之 
间 。 为 在 实验 中 进一步 引入 动态 性 ， 仿 真 器 每 Ss 随机 地 重新 定位 球 的 位 置 。 

在 第 一 个 实验 中 ， 仿 真 器 在 理想 感知 器 下 进行 模拟 ， 即 没有 量 测 噪声 和 误 
差 。 图 10.7 中 给 出 了 丢 包 情况 下 的 实验 结果 ， 图 10. 8 给 出 了 人 为 包 延 迟 的 实验 
结果 。 其 中 ， 每 个 数据 点 代表 45min 的 仿真 结果 。 

由 图 10.7 可 得 出 结论 : 首先 ， 从 图 中 可 知 在 理想 网 络 情况 下 且 没 有 冲突 
消解 时 ，TTC 大 约 是 100ms，BC 值 为 1.04。 因 此 ， 在 平均 经 过 一 个 通信 周期 
和 三 个 审议 周期 之 后 ， 机 器 人 会 达成 共识 。 由 于 在 该 配置 下 没有 持续 冲突 ， 因 
此 有 冲突 消解 的 任务 分 配 的 性 能 相同 。 尽 管 在 Kaminka 和 Tambe' ”的 实验 中 ， 
团队 成 员 在 每 个 审议 周期 内 能 够 通信 ， 但 本 实验 的 结果 仍 可 与 其 所 测 得 的 ATA 
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图 10.7 模拟 丢 包 情况 下 的 协调 时 间 和 信念 状态 个 数 
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包 延 迟 /s 
图 10.8 ”模拟 包 延 迟 情况 下 的 协调 时 间 和 信念 状态 个 数 
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其 次 ， 在 有 /无 冲突 消解 的 任务 分 配 中 ， 丢 包 率 达到 50% 之 前 BC 值 都 是 
缓慢 增 大 ， 从 达到 50% 开始 BC 值 指数 增 大 。 对 于 TTC 值 也 是 如 此 。 值 得 注意 
的 是 ， 丢 包 率 越 高 ， 智 能 体 就 越 可 能 由 于 缺少 所 接收 的 消息 而 错误 地 认为 其 他 
智能 体 已 损坏 (参见 7. 5.2 节 )。 当 丢 包 率 达到 60% ~70% 时 ， 这 种 情况 就 会 
更 明显 。 

相对 于 丢 包 率 ， 在 系统 中 引入 包 延 迟 会 有 完全 不 同 的 效果 ， 如 图 10. 8 所 示 。 
无 冲突 消解 时 ， 相 对 于 丢 包 ， 团 队 更 能 适应 包 延 迟 。 这 也 正 是 所 期 望 的 ， 因 为 机 
器 人 主要 是 根据 仿真 器 所 提供 的 理想 局 部 数据 来 进行 决策 ， 并 得 出 相同 结论 的 。 
因此 ， 随 着 包 延 迟 ， 指 标 只 会 稍微 增加 。 然 而 在 有 冲突 消解 时 ， 包 延迟 对 协调 时 
间 具 有 显著 影响 。 综 合 起 来 ， 导 致 产生 这 种 影响 的 原因 有 两 个 : 

o 由 于 智能 体 接收 过 去 事件 的 信息 ， 然 后 通过 动态 重 分 配 来 进行 相应 的 更 
新 ， 因 此 包 延 退会 在 任务 分 配 历史 中 引入 循环 周期 ， 由 此 触发 了 冲突 消解 协议 。 
利用 同步 时 钟 〈 即 利用 NTP PO) 的 特点 并 删除 或 修改 一 段 时 间 之 前 的 消息 
可 消除 这 种 影响 ， 由 此 提高 团队 协调 一 致 的 性 能 。 

@ 冲突 消解 在 很 大 程度 上 需要 依赖 通信 。 权 威 模式 下 ， 由 广播 分 配 结果 的 
单个 机 器 人 来 求解 任务 分 配 问题 。 权 威 消息 的 延迟 会 对 团队 的 协调 一 致 产生 很 大 
影响 。 领 导 者 机 器 人 每 次 作出 决策 时 ， 在 团队 接收 并 对 相应 消息 做 出 反应 之 前 ， 
其 他 机 器 人 都 不 能 达成 一 致 ， 除 了 包 延 迟 时 间 之 外 ， 该 过 程 需 要 50ms。 而 在 正 
常 模式 下 ， 智 能 体 可 同时 对 环境 作出 反应 。 

在 下 一 个 实验 中 ， 修 改 仿真 器 配置 以 在 感知 的 足球 位 置 处 引入 系统 误差 ， 
使 得 每 个 机 融 人 所 观测 到 的 足球 位 置 比 其 实际 位 置 近 了 30cm。 该 系统 误差 大 
致 可 模拟 在 灯光 较 差 的 条 件 下 图 像 处 理 过 补偿 的 实际 情况 。 在 环境 光 或 漫 反射 
光 较 少 而 主要 是 直射 光 的 情况 下 ， 造 成 足球 的 下 半 部 分 呈现 黑色 而 不 再 被 认为 
是 足球 的 一 部 分 ， 由 此 会 导致 对 与 足球 之 间距 离 的 过 估计 。 在 实际 中 ， 可 利用 
启发 式 方法 消除 该 影响 ， 但 同时 又 会 对 该 影响 过 补偿 ， 从 而 使 得 足球 比 实 际 上 
显得 更 近 。 

图 10.9 给 出 了 包 丢 失 情 况 下 的 协调 结果 ， 图 10. 10 给 出 了 包 延 迟 情况 下 的 
协调 结果 。 数 据 表明 ， 当 团队 内 部 在 信念 上 产生 分 歧 时 (如 由 于 存在 系统 感知 
误差 ) ， 冲 突 消 解 具有 很 大 优势 。 在 理想 的 网 络 条 件 下 ， 团 队 内 部 的 信念 状态 平 
均 为 1.2， 这 比 之 前 没有 系统 误差 的 情况 降低 了 大 约 20% 。 利 用 冲突 消解 ，BC 
值 可 降 到 1. 08。 这 两 种 协调 机 制 的 差别 在 TTC 中 更 明显 ， 在 理想 网 络 状态 下 利 
用 冲突 消解 机 器 人 团队 在 信念 上 达成 共识 所 用 的 TTC 时 间 平 均 为 130ms ， 而 冲突 
持续 时 间 为 450ms。 在 具有 理想 感知 数据 的 情况 下 ， 冲 突 消解 不 可 能 得 到 如 此 好 
的 结果 ， 这 是 由 于 需要 在 冲突 解决 之 前 首先 检测 出 冲突 并 进行 通信 。 

直到 丢 包 率 达 到 60% 时 ， 冲 突 消解 才能 提高 性 能 ， 若 在 此 时 丢失 权威 消息 ， 
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图 10.9 具有 系统 误差 的 丢 包 情况 下 的 协调 
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包 延 迟 /s 
图 10.10 具有 系统 误差 的 包 延 迟 下 的 协调 
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则 会 导致 更 多 难以 解决 的 冲突 。 对 于 包 延 迟 ， 也 存在 类 似 的 情况 〈 见 图 10. 10) , 
直到 延迟 达到 300ms 时 ， 冲 突 消解 才 会 降低 协调 时 间 。 此 时 通过 通 人 
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无 冲突 消解 的 情况 下 开始 表现 得 更 好 。 

有 趣 的 是 ， 在 本 实验 中 实际 上 会 由 于 包 延 迟 而 减少 无 冲突 消解 的 TTC。 这 是 
由 于 感知 数据 融合 和 包 延 迟 之 间 的 非常 复杂 的 关联 所 导致 的 ， 包 延迟 会 增 大 局 部 
观测 的 运动 目标 和 远程 观测 的 运动 目标 之 间 的 距离 。 在 某 些 点 处 ， 不 再 融合 不 同 
的 观测 数据 ， 而 是 由 感知 数据 融合 算法 认为 是 两 个 不 同 的 物体 。 由 于 远程 定位 信 
息 与 本 地 障碍 信息 不 匹配 ， 由 此 一 个 带 球 机 器 人 会 被 队友 认为 是 对 方 球员 。 另 外 
由 于 场 上 只 能 有 一 个 足球 ， 机 器 人 只 能 选择 一 种 假设 。 这 可 基于 Dempster-Shafer 
理论 "进行 精确 计算 而 获得 (参见 参考 文献 [131] 中 有 关 该 场景 的 详细 描 
述 ) 。 在 这 种 情况 下 ， 机 器 人 更 倾向 于 离 足 球 最 近 的 那个 机 器 人 〈 即 带 球 机 器 
A) 的 观测 结果 ， 这 是 由 于 该 机 器 人 具有 最 高 的 可 信和 度 。 因 此 只 要 与 足球 之 间 
的 距离 、 延 迟 时 间 以 及 带 球 机 器 人 的 速度 均 足 够 大 ， 那 么 其 他 机 器 人 就 会 采用 带 
球 机 器 人 所 发 送 的 延迟 信息 ， 而 不 用 其 自身 的 感知 信息 ， 因 此 包 延 迟 可 部 分 地 提 
高 团队 中 信念 基 的 协调 一 致 程度 。 

在 此 不 详细 讨论 具有 感知 噪声 情况 的 实验 结果 。 在 实验 中 ， 感 知 噪声 会 导致 
性 能 略微 下 降 ， 这 是 可 想 而 知 的 。 除 此 以 外 ，TTC 和 BC 的 整体 表现 与 具有 理想 
数据 的 情况 相似 。 

总 之 ， 在 理想 条 件 下 争议 时 间 为 100ms，50% 丢 包 率 的 情况 下 争议 时 间 为 
230 ~250ms, ， 而 延迟 时 间 为 200ms 下 的 争议 时 间 为 110 ~270ms， 由 此 可 得 出 结论 : 
智能 体 不 仅 能 够 快速 响应 环境 变化 ， 而 且 还 能 够 在 任务 分 配 上 迅速 达成 一 致 ， 然 后 
按照 所 建 模 的 规划 来 行动 和 合作 。 此 外 只 要 网 络 条 件 不 太 差 ， 就 能 够 通过 冲突 消 
解 来 有 效 地 抵消 掉 系 统 感知 误差 。 

在 真实 场景 中 ， 网 络 质量 不 可 能 像 上 述 实验 中 那么 稳定 。 实 际 上 ， 网 络 情况 
易 受 突 发 错误 的 影响 ， 会 在 较 短 时 间 内 影响 丢 包 和 包 延 迟 。 在 此 情况 下 ， 如 果 突 
发 错误 持续 时 间 较 长 ， 则 团队 性 能 会 如 上 述 实验 中 那样 快速 下 降 。 由 于 每 个 智能 

会 计算 其 独立 参与 的 团队 决策 ， 并 一 直 保 持 该 信念 ， 直 到 获得 冲突 信息 或 由 于 
长 时 间 没 有 接收 消息 而 认为 其 他 机 器 人 已 退出 该 行为 ,这 时 就 可 补偿 短 时 突 发 
错误 。 

协调 一 致 的 程度 取决 于 域 的 动态 性 、 网 络 的 可 靠 性 以 及 感知 信息 的 一 致 性 。 
在 这 三 种 因素 要 求 极其 苛刻 的 设置 下 ， 任 何 一 种 协调 方法 都 会 失败 ， 然 而 利用 其 
他 协调 方法 (如 行为 识别 或 利用 环境 进行 通信 ) 可 应 对 这 种 极端 情况 。 根 据 Hu- 
ber 和 Durfee ”的 工作 思路 来 集成 行为 识别 是 今后 的 研究 工作 。 


10.3 约束 求解 与 优化 


对 于 多 智能 体 协 作 ，ALICA 区 别 于 其 他 方法 的 主要 特点 之 一 是 集成 了 约束 
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满足 和 优化 问题 。 在 定义 9. 1 中 ， 提 出 了 一 个 适用 于 各 种 机 器 人 和 多 机 器 人 的 问 
题 类 ， 即 非 线性 连续 约束 满足 问题 (CNLCSP) 。 随 后 ， 设 计 了 一 个 能 够 在 真实 
场景 中 解决 该 问题 类 并 且 协 调 团 队 结果 的 求解 器 。 该 求解 器 以 及 问题 类 的 目的 是 
提供 一 个 具有 可 交换 性 的 相应 接口 ， 由 此 对 于 不 同 的 域 ， 可 利用 不 同 的 问题 类 来 
描述 团队 行为 ， 然 而 上 述 算 法 已 集成 到 ALICA 的 参考 实现 中 。 在 参考 文献 
[155] 中 利用 机 器 人 领域 中 所 提炼 的 问题 ， 对 该 求解 器 以 及 其 他 求解 器 的 性 能 
进行 了 详细 评估 。 在 这 些 实验 中 ,第 9 章 所 介绍 的 求解 器 性 能 最 佳 ， 能 够 在 可 接 
受 的 时 间 内 以 近乎 实时 推理 的 方式 求解 大 多 数 基 准 约束 问题 。 

接 下 来 的 一 系列 实验 对 抗 噪 稳定 性 以 及 利用 分 布 式 约 东 满 足 和 优化 方法 所 实 
现 的 协调 程度 进行 了 评估 。 在 每 个 实验 中 ， 智 能 体 团队 求解 一 个 类 似 于 机 器 人 场 
景 所 发 生 的 约束 满足 或 约束 优化 问题 ， 每 个 参与 的 智能 体 都 单独 具有 高 斯 噪声 。 
类 似 于 真实 场景 ， 每 个 智能 体 在 每 个 审议 周期 内 都 求解 约束 问题 。 经 500 次 迭代 
后 ， 智 能 体 终止 运行 。 

最 后 ， 测 量 随时 间 变 化 的 每 个 智能 体 的 标准 偏差 以 及 任 一 时 间 点 处 团队 的 标 
准 偏差 。 

10.3.1 约束 环 问题 

首先 ， 以 一 个 简单 的 二 次 优化 约束 问题 来 评估 所 提 方 法 。 

设 c 为 [ -10*,，10]? 中 的 一 个 固定 随机 点 ， 和 寻找 一 点 pe [一 10*,，10”]? 以 
使 得 

o(p) =4x10* - le-p| 
在 |c-p| 宇 2 x10 条 件 下 最 大 。 

最 优 解 集合 是 以 c 点 为 圆心 ， 半 径 为 2x10 的 一 个 圆 ， 该 圆 外 的 所 有 点 都 为 
解 。 值 得 注意 的 是 ， 其 中 的 常数 以 及 目标 函数 是 用 于 保证 函数 映射 到 大 于 1 的 
值 。 这 是 由 于 求解 器 中 的 一 个 实现 细节 ， 仅 是 通过 一 个 较 小 的 边 距 来 简化 必要 计 
算 ， 并 没有 其 他 影响 。 在 本 实验 中 ， 每 个 参与 智能 体 都 在 偏差 为 o;, 的 各 向 同性 
高 斯 噪声 下 来 感知 点 po 

图 10. 11 给 出 了 随时 间 变 化 的 每 个 智能 体 的 平均 标准 差 。 注 意 到 ,在 只 有 1 ~ 
2 个 智能 体 的 情况 下 ， 这 种 输出 噪声 会 急剧 增 大 。 而 噪声 较 大 时 ， 智 能 体 就 无 法 可 
靠 地 跟踪 之 前 的 解 。 然 而 随 着 智能 体 参 与 数量 的 增多 ， 噪 声 会 明显 下 降 。 若 增加 第 
三 个 智能 体 ， 这 种 效果 会 更 加 明显 ， 之 后 呈现 出 收益 递减 的 效应 。 这 种 情况 正如 所 
预期 的 那样 ， 交 换 解 作为 局 部 搜索 的 起 始点 ， 只 要 存在 大 多 数 ， 则 多 数 表决 结果 会 
得 到 稳定 解 。 增 大 表决 投票 的 数量 对 解 的 影响 非常 小 。 

图 10. 12 给 出 了 团队 在 任 一 时 间 点 的 平均 标准 差 ， 这 是 对 团队 协调 一 致 程度 
的 一 种 衡量 。 品 声 测量 值 越 高 ， 则 团队 行为 就 越 不 能 协调 一 致 。 通 过 两 种 测量 方 
法 的 比较 ， 可 知 团队 噪声 始终 小 于 随时 间 变 化 的 噪声 。 因 此 尽管 作为 整体 的 团队 
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图 10.11 约束 环 问题 中 随时 间 变化 产生 的 噪声 


仍然 易 受 到 感知 噪声 的 影响 ， 但 还 是 能 够 达到 协调 一 致 。 实 际 上 ， 团 队 噪 声 仅 略 

高 于 输入 噪声 。 
600 g= 
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图 10. 12 ”约束 环 问 题 中 团队 所 产生 的 噪声 


图 10. 13 给 出 了 输入 噪 oh ed op Mt en 
可 知 ， 当 增加 第 三 个 智能 体 时 ， 品 声 水 平 随 时 间 变 化 急剧 下 降 ， 而 且 对 于 新 增加 
的 智能 体 ， rab Wl 团队 噪声 只 会 稍微 增加 。 这 
些 品 声 的 增 大 反映 了 由 于 输入 点 ec 的 分 布 而 导致 的 解 的 分 布 。 

10.3.2 拦截 问题 
在 第 二 个 实验 中 ， 采 用 机 器 人 足球 领域 中 的 一 个 简单 问题 。 给 定 四 个 对 手机 
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图 10. 13 ”约束 环 问题 中 ci =400 时 所 产生 的 噪声 


器 人 的 位 置 以 及 足球 位 置 ， 任 务 是 确定 三 个 场 上 位 置 ， 分别 是 至 少 离 球 2m 远 、 
机 器 人 之 间 的 相互 距离 至 少 Im 以 及 在 对 手 与 球 的 方向 上 距离 0.7m 远 。 这 是 一 
个 无 目标 函数 的 析 取 约束 满足 问题 。 
一 般 而 言 ， 给 定 [ -10 ”mm，10 mm] 中 某 一 固定 随机 点 5, 确定 p,,，p;,， ps E 
[ -10*mm, 10*mm]*, Hoi, 03, 03, 0, 为 距离 6 点 2.5~ 8m 范围 内 均匀 分 布 的 固 
定点 。 则 解 必须 满足 : 
(( Vi) |p, -b| 22m) A (10. 1) 
|p, -p.|21mA |p, -p;|21mA |p, -p;|>1mA (10. 2) 
(cv (ap |p, -o eT 
式 (10.3) 中 下 标 i 和 j 分别 表示 相应 的 结合 与 分 离 的 缩写 。 由 此 ， 解 限制 
为 四 个 对 手机 器 人 之 前 ， 精 度 为 lcm 的 任意 点 组 合 。 通 常 ， 会 对 该 场景 增加 一 
个 目标 函数 以 使 得 每 个 机 器 人 运动 到 目标 位 置 的 距离 最 小 。 在 此 ， 没 有 设置 目标 
函数 ， 是 为 了 保证 这 是 一 个 纯粹 的 约束 满足 问题 ， 并 且 可 避免 引入 目标 函数 所 具 
有 的 噪声 。 所 有 观测 值 (包括 球 和 对 手 的 位 置 ) 都 易 受 到 各 向 同性 高 斯 噪声 的 
影响 ， 其 中 偏差 为 Cn, WEBEN mm。 
图 10. 14 给 出 了 随时 间 变 化 所 产生 的 噪声 ， 这 与 10.3. 1 节 中 比较 简单 的 结 
合约 束 优化 问题 具有 相同 特征 ， 只 是 所 产生 的 噪声 更 大 。 这 是 可 预见 的 ， 因 为 在 


<0. 01m) (10.3) 
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方程 中 不 只 一 个 噪声 点 ， 而 是 有 五 个 噪声 点 ， 且 每 个 可 能 的 目标 位 置 都 与 两 个 品 
声 点 有 关 。 另 外 ， 一 且 智 能 体 无 法 跟踪 解 ， 就 可 能 切换 到 一 个 完全 不 同 的 解 
( 即 分 离 中 的 不 同情 况 ) ， 从 而 产生 一 个 较 大 的 方差 。 在 某 些 情况 下 ， 由 于 第 二 
个 约束 要 求 目标 位 置 之 间 的 距离 最 小 ， 因 此 甚至 必须 跟踪 一 个 解 。 在 某 些 情况 
下 ，CSP 甚至 是 不 可 解 的 ， 即 如 果 对 手机 器 人 之 间 相 互 距离 过 近 或 对 手机 器 人 与 
球 距 离 过 近 。 这 种 情况 发 生 的 概率 为 0.042% ， 即 每 45s 发 生 一 次 。 
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图 10. 14 “拦截 问题 中 随时 间 变 化 所 产生 的 噪声 


同 理 ， 图 10. 15 给 出 了 与 上 一 示例 相同 的 趋势 。 团 队 所 产生 的 噪声 总 是 低 于 
随时 间 变 化 的 噪声 ， 因 此 即使 在 丢失 对 解 的 跟踪 时 ， 机 器 人 也 能 够 协调 一 致 。 图 
10. 16 给 出 了 1 ~5 个 智能 体 随时 间 变 化 所 产生 噪声 的 二 维 投影 。 再 次 表明 ， 一 
上 且 有 第 三 个 智能 体 参 与 ， 则 噪声 会 急剧 下 降 ， 且 每 增加 一 个 智能 体 ， 收 益 会 
递减 。 

10.3.3 逆 运 动 学 

最 后 一 个 实验 是 利用 逆 运 动 学 问题 。 在 此 ， 目 标 是 定位 一 个 Kinova 生产 的 
Jaco™ 机 器 辟 的 末端 执行 器 。 该 机 器 辟 具 有 六 个 自由 度 。 在 齐 次 坐标 系 中 对 应 于 
点 的 末端 执行 器 位 置 为 

p=M,-M,-M,-M,-M,-M, (0,0,0,1) 
式 中 M 一 一 机 械 臂 中 第 ;个 关节 的 一 个 变换 矩阵 。 

每 次 变换 都 与 一 个 自由 度 有 关 。 末 端 执行 器 的 朝向 由 具有 元 素 mi 的 变换 拢 
阵 M =M AM AM AM AM Me 来 定义 。 在 给 定 目标 点 g 和 元 素 为 7; 的 目标 
旋转 矩阵 R 的 条 件 下 ， 目 标 函 数 为 


U = 1000 -I g-pl- YY (m; -7,)’ 
i j 
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图 10. 16 ”拦截 问题 中 随时 间 变 化 所 产生 的 噪声 
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在 此 不 增加 任何 约束 ， 因 此 这 是 一 个 完备 的 非 约束 优 化 问题 。 在 实验 中 ， 目 


标点 和 目标 朝向 的 每 一 维 都 受 高 斯 噪声 ci 的 影响 。 


图 10. 17 给 出 了 不 同 个 数 智能 体 随时 间 变 化 所 产生 的 噪声 。 值 得 注意 的 是 ， 机 
械 臂 的 最 大 行程 大 约 是 1. 5m， 因 此 相 比 于 机 械 臂 的 工作 范围 ，0. 1 的 输入 噪声 就 
已 经 相当 大 了 ， 这 样 噪 声 较 大 也 就 并 不 奇怪 。 然 而 由 图 可 知 ， 由 于 是 多 个 智能 体 共 


同 求解 ， 输 出 噪声 会 减 小 。 另 外 ,与 之 前 的 实验 一 样 ， 收 益 递 减 也 非常 明显 
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为 进行 比较 ， 在 图 10. 18 中 给 出 了 5 个 智能 体 时 团队 产生 的 噪声 和 随时 间 变 
化 所 产生 的 噪声 。 在 具有 相同 输入 噪声 的 两 种 测量 下 ， 团 队 产 生 的 噪声 要 低 于 随 
时 间 变 化 的 噪声 。 因 此 在 非 约束 场景 下 ， 团 队 也 可 以 协调 一 致 。 
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Vy 1 1 | 
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Voc an oi Et ae oe 和 
1 1 1 $ 
上 1 i i 
1 | 1 i 
je- i = 一 Paes A he Hae Sag Seo FES Sy 
1 1 1 i 
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10.3.4 本 节 小 结 

总 而 言 之， 实验 证 明 ， 所 提 算 法 对 于 纯粹 的 约束 满足 问题 、 纯 粹 的 约束 优化 
问题 以 及 约束 满足 与 约束 优化 混合 问题 均 能 实现 团队 的 协调 一 致 。 对 于 特定 问 
题 ， 单 个 决策 仍然 会 在 一 定 程度 上 受 噪 声 的 影响 。 由 于 要 在 反应 能 力 和 抗 品 鲁 棒 
性 之 间 达 到 平衡 ， 因 此 不 可 能 在 不 牺牲 一 定 程度 反应 能 力 的 情况 下 达到 更 好 的 结 
果 。 在 所 有 实验 中 ， 每 个 智能 体 都 根据 具有 噪声 的 局 部 感知 数据 求解 给 定 约束 问 
题 。 也 就 是 说 ， 所 用 方法 主要 还 是 关注 于 反应 能 力 。 值 得 注意 的 是 ， 该 算法 通常 
与 平滑 或 感知 数据 融合 等 预 处 理 相 结合 。 在 此 ， 认 为 这 种 相 结合 的 方法 可 应 用 于 
所 有 真实 场景 。 


10.4 案例 分 析 : 外 太空 探索 


4£1.3.2 WP, 讨论 了 外 太空 探索 可 能 是 ALICA 的 一 个 目标 场景 。 由 于 这 
种 场景 通常 需要 高 度 专业 化 的 设备 来 完成 特定 任务 ， 因 此 可 假设 机 器 人 团队 都 是 
异 构 的 。 即 整个 团队 由 不 同 的 机 器 人 组 成 ， 每 个 机 器 人 都 具有 不 同 的 能 力 和 执行 
机 构 。 

在 ALICA 中 ,对 异 构 团 队 的 表示 和 推理 非常 简单 ， 这 是 由 于 ALICA 允许 根 
据 所 需 的 能 力 来 定义 角色 ， 然 后 在 应 执行 的 规划 中 将 这 些 角 色 与 任务 相关 联 。 

考虑 一 个 月 球场 景 如 下 : 一 个 机 器 人 团队 的 任务 是 寻找 并 取 回 通信 基站 的 部 
件 ， 这 些 部 件 分 布 在 一 个 未 知 环境 中 。 该 团队 由 四 个 配置 有 用 于 探索 的 不 同 传 感 
器 的 小 机 器 人 和 两 个 配置 有 用 于 抓 取 和 运送 部 件 的 机 械 臂 的 较 大 机 器 人 组 成 。 

为 区 分 这 两 种 机 器 人 ， 引 入 以 下 能 力 : 

emi: iT, Llo 

em mk: {T, Lio 

e 可 运送 : |T, Ll. 

根据 这 些 能 力 ， 可 定义 团队 角色 

R= |Scout, Transporter| 

侦察 (Scout) 角色 要 求 机 器 人 速度 快 ， 而 运输 (Transporter) 角色 则 要 求 机 
器 人 可 抓 取 和 运送 物体 。 然 后 通过 角色 分 配 将 小 机 器 人 与 侦察 角色 相关 联 ， 而 较 
大 机 器 人 与 运输 角色 相关 联 。 值 得 注意 的 是 ， 这 个 例子 稍 显 简单 ， 不 过 可 以 很 容 
易 地 想象 一 个 更 异 构 的 团队 组 成 ， 其 中 某 些 机 器 人 可 抓 取 物体 ， 但 不 能 运送 太 
远 。 在 这 种 情况 下 ， 运 输 角色 就 可 分 解 为 运输 和 装载 两 种 角色 。 

图 10. 19 描述 了 如 何在 最 高 层 将 该 问题 表示 为 一 个 ALICA 规划 。 侦 察 机 器 
人 可 执行 侦察 任务 ,运输机 器 人 执行 取 回 (Retrieving) 任务 。 所 有 决策 都 是 基 
于 角色 和 任务 的 优先 级 完成 ， 这 包括 一 个 特定 角色 是 否 能 执行 一 个 特定 任务 ， 以 
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及 执行 的 好 坏 程度 。 


a] 


定位 所 有 部 件 


所 有 不 在 目标 点 的 已 知 物体 
Ta 子 任务 成 功 完成 


所 有 物体 取 回 


10.19 ”搜索 和 取 回 的 规划 


侦察 机 器 人 执行 搜索 (Search) 规划 类 型 ， 直 到 所 有 部 件 均 找 到 ， 然 后 返回 
基地 。 运 输 机 器 人 在 状态 2 下 空闲 ， 直 到 发 现 一 个 部 件 ， 这 时 开始 执行 取 回 物 
体 (RetrieveObject) 的 任务 。 一 且 完 成 一 个 取 回 物体 的 任务 ， 则 相应 的 机 器 人 
就 又 会 恢复 到 空闲 状态 Z,。 阁 所 有 的 物体 都 被 取 回 ， 则 所 有 的 运输 机 器 人 就 成 
功 地 完成 该 任务 。 

取 回 物体 和 搜索 这 两 个 规划 类 型 是 进一步 展示 ALICA 能 力 的 很 好 示例 。 首 
先 讨论 取 回 物体 规划 类 型 。 正 如 取 回 规划 的 基数 所 示 ， 该 规划 类 型 应 工作 于 任意 
个 机 器 人 和 物体 的 情况 下 。 
10.4.1 取 回 物体 规划 类 型 

在 后 面 的 章节 中 ， 假设 存在 以 下 的 域 谓词 : 

è Distance(a, b, d): d 为 位 置 c 和 2 之 间 的 距离 。 

© componentsLocated(n): n 为 已 定位 但 还 未 被 运输 的 部 件 个 数 。 

è Position(a, p): 智能 体 a 位 于 位 置 p。 

© Near(p, 0): 位 置 p 靠近 物体 o。 

© Component(o) : o 为 一 个 已 定位 但 尚未 被 运输 的 部 件 。 
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图 10. 20 给 出 了 一 种 取 回 物体 的 可 能 实现 : 取 回 物体 实现 RetrieveObjImpl。 
该 实现 包括 两 个 任务 : 取 回 和 空闲 。 直 观 上 ， 多 余 的 运输 机 器 人 应 空 阅 ， 直 到 
侦察 机 器 人 寻找 到 更 多 的 部 件 。 这 是 由 运行 时 条 件 和 效用 函数 相 结 合 来 实 
现 的 : 


取 回 物体 实现 


成 功 (向 目标 运动 ) 


成 功 ( 抓 取 物体 ) 


OO 
| 部 下 物体 O 向 基地 运动 
0.,co 
成 动 ( 印 下 物体 ) 


Æ 10.20 取 回 物体 的 规划 


Run( RetrieveObjImpl) = componentsLocated (n) A 
| {a|In(a,RetrieveObjImpl], Retrieving ,z) } | <n 
U( RetrieveObjImpl) = pri( RetrieveObjImpl) + 


| {alIn(a, RetrieveObjImpl , Retrieving ,z) } | 
| {al In(a, RetrieveObjlmpl ,z ,z) } | 


值得 注意 的 是 ， 根 据 任 务 分 配 算法 ， 隐 式 空闲 已 实现 期 望 行为 。 在 此 ， 采 用 
显 式 空 闲 任务 以 使 得 效果 更 加 明显 。 

每 个 执行 取 回 任务 的 运输 机 器 人 首先 应 运动 到 一 个 特定 物体 处 ， 然 后 抓 起 并 
运 回 基地 。 这 种 根据 物体 对 机 器 人 的 任务 分 配 是 由 一 个 约束 系统 完成 的 ， 记 
H yp: 

w =(Va)( dg) (( dz) In(a, RetrieveObjlmpl, Retrieving, z) )—Position(a,p ) 

A GoalPosition(a,g) 人 Component(o) A Near(g,o) A Distance(p,o,d) 


160 自主 移动 机 器 人 行为 建 模 与 控制 


(Va’)(( 43z)In(a’,RetrieveObjImpl, Retrieving,z) A a # a’) — Position 
(a',p’) A Distance(p'’,o,d’) Ad <d' 

式 中 GoalPosition(a, g) 智能 体 功 能 流 。 

少 中 包括 运输 机 器 人 接近 要 运输 部 件 的 一 个 目标 位 置 。 另 外 ， 还 应 限制 该 机 
器 人 与 所 选 部 件 之 间 的 距离 要 小 于 其 他 运输 机 器 人 与 该 部 件 之 间 的 距离 。 定 义 
8.8 中 所 介绍 的 展开 步骤 可 去 除 所 有 智能 体 量词 ， 从 而 使 得 公式 更 适 于 进行 约束 
求解 。 

由 此 ,行为 向 目标 运动 可 不 断 查 询 应 运动 到 一 个 适当 位 置 。 一 旦 机 器 人 到 达 
该 目标 位 置 ， 就 会 进入 状态 Z, ， 此 时 两 个 行为 抓 取 物体 和 定位 相互 配合 来 抓 取 
物体 。 通 过 将 运动 朝向 的 目标 位 置 与 抓 取 物体 行为 所 面临 的 逆 运 动 学 问题 相 结 合 
来 实现 上 述 配 合 。 因 此 ， 定 位 行为 可 使 得 机 器 人 运动 到 可 抓 取 物体 的 位 置 。 

由 于 这 些 行为 的 实现 是 与 特定 域 高 度 相关 的 ， 且 已 超出 本 书 范围 ， 因 此 在 
这 里 并 不 详细 介绍 这 些 行为 。 所 得 到 的 一 个 重要 结论 是 利用 ALICA 能 够 很 容 
易 地 描述 由 多 个 机 器 人 同时 采集 的 物体 。 在 多 余 的 机 器 人 参与 进来 之 前 都 是 处 
于 空闲 状态 。 最 后 ， 控 制 不 同 执行 机 构 的 行为 可 利用 约束 由 相应 的 变量 进行 
组 合 。 
10.4.2 ”搜索 规划 类 型 

除了 取 回 部 件 之 外 ， 该 场景 中 的 第 二 个 重要 任务 是 搜索 部 件 。 合 作 搜 索 已 在 
过 去 得 到 广泛 研究 〈 如 参考 文献 [18] ) 。 有 效 的 合作 搜索 主要 是 依靠 交换 和 合 
并 表征 环境 的 数据 结构 ， 但 这 并 不 是 ALICA 所 涵盖 的 内 容 。 因 此 搜索 规划 类 型 
的 所 有 实现 在 很 大 程度 上 都 是 依赖 于 外 部 特定 域 的 数据 表征 。 在 此 并 不 深入 探讨 
这 种 表征 方法 ， 而 是 主要 关注 于 如 何 利用 约束 来 协调 多 机 器 人 的 运动 ， 以 实现 对 
某 一 区 域 的 搜索 。 

要 搜索 一 个 特定 物体 ， 应 首先 提供 某 些 表明 物体 可 能 所 处 位 置 的 先 验 知识 。 
这 些 先 验 知识 可 表示 为 Dempster-Shafer 理论 …” 中 的 一 个 概率 函数 或 信念 函 
数 。 团 队 机 器 人 搜索 某 一 区 域 所 采用 的 搜索 模式 可 适用 于 该 函数 的 具体 实现 。 如 
果 没 有 任何 相关 信息 ， 则 概率 函数 近似 为 一 个 均匀 分 布 。 在 此 情况 下 ， 如 图 
10. 21a 所 示 的 一 个 搜索 模式 就 可 能 是 一 个 比较 合理 的 选择 。 另 一 方面 ， 如 果 在 
某 一 特定 区 域 的 概率 函数 较 密 集 (如 一 个 正 态 分 布 ) ， 则 一 种 起 始 于 正 态 分 布 中 
心 的 螺旋 形 模式 会 更 适合 。 

根据 这 一 搜索 模式 ， 可 通过 一 个 简单 扩展 的 ALICA 约束 系统 来 构成 一 个 
编队 ， 即 将 约束 问题 与 全 状态 反馈 相关 联 。 在 此 编队 (如 一 列 ) 可 由 一 个 
点 和 一 个 角度 来 描述 ， 该 点 用 于 更 新 实现 搜索 模式 的 控制 器 。 在 随后 的 约束 
问题 中 ， 控 制 器 可 提供 相应 的 下 一 个 点 ， 从 而 使 得 机 器 人 沿 着 所 实现 的 路 径 


运动 。 
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图 10. 21 搜索 模式 
a) 矩形 模式 b) 螺旋 形 模式 
本 书 所 提出 的 架构 如 图 10. 22 所 示 。 行为 不 断 查询 求解 器 来 获得 对 变量 的 
解 ， 对 执行 器 发 布 命令 并 利用 新 的 控制 点 来 更 新 模式 发 生 器 。 然 后 模式 发 生 器 调 
整 控制 点 以 适应 搜索 模式 ， 并 产生 一 个 新 的 控制 点 ， 在 一 个 小 时 间 间 隔 内 来 更 新 
下 一 次 迭代 的 约束 求解 器 。 实 现 协调 运动 的 约束 问题 可 由 以 下 宏 进行 定义 : 


感知 输入 
a | 
_t 新 的 控制 点 
RW 
查询 m ERRER 
ps a 
aes 所 得 的 控制 点 
动作 命令 


图 10.22 编队 闭环 控制 


def 
Line(r,x,y;Q,p,7T,c, ,¢, ,B) = J(e, =x) + ea -y)’ <tol, A 


J (cos(B) —cos(a) )* + (sin(B) -sin(a) )? <tol, A 
n= | {a|In(a,p,7,z) }| Alen =2rn A 
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(Va)( 3z)In(a,p,T,z)—(GoalPosition(a,g) A 
|(g, -c,)cos(8) + (g, =c, )sin(8) | <£ A 
len 


lg-s A 


( Va')( dz)In(a',p,T,z)a#a'—> 


( GoalPosition(a’,g") A lg -g'1 =“ e) 

AFP c,、c, 和 BpB 一 一 约束 变量 。 

Line (n, r, x, Y, @, P, T, Cs, €, B) 使 得 执行 规划 p 中 任务 7 的 所 有 
机 器 人 的 目标 位 置 均匀 分 布 在 一 条 长 度 为 2rn 的 直线 上 ， 其 中 为 参与 机 器 人 的 
个 数 ，r 为 机 器 人 的 观测 半径 。 该 直线 的 位 置 和 朝向 由 坐标 x 和 y 以 及 角度 a 确 
定 ， 使 之 正 交 对 齐 。 参 数 p 和 7 分 别 是 指 智能 体 的 规划 和 任务 。 值 得 注意 的 是 ， 
该 约束 充分 利用 非 线性 和 超越 函数 来 定义 相对 于 控制 点 (x，y，a) 的 该 直线 。 

由 常量 tol, 、tolu 和 & 来 实现 公差 。 这 些 公差 可 对 无 任何 集中 控制 的 CSP 协 
调 提 供 裕 量 。 为 使 得 直线 中 的 位 置 稳定 并 在 机 器 人 的 实际 位 置 中 集成 反馈 信息 ， 
可 对 CSP 增加 一 个 目标 函数 : 


o(p,T) = | {a|In(a,p,7,z)t | - 10" - > | GoalPosition(a) - Position(a) | 


a:( Jz)In(a,p,r,2) 

olp, T) 可 将 运动 到 目标 位 置 的 代价 作为 二 次 方 距离 和 。 

该 约束 优化 问题 的 解 包括 两 个 方面 。 首 先 包含 所 有 参与 机 器 人 的 目标 位 置 ， 
其 次 还 包含 一 个 由 c.、c, 和 8B 给 定 的 控制 点 ， 即 在 允许 的 公差 范围 内 ,最 大 可 能 
地 偏离 输入 控制 点 。 

图 10. 23 给 出 了 四 个 模拟 机 器 人 执行 一 个 矩形 模式 〈 见 图 10. 23a) 和 一 个 
螺旋 形 模式 〈 见 图 10. 23b) 所 产生 的 路 径 。 机 器 人 能 够 协调 运动 以 保持 一 个 搜 
索 路 线 。 值 得 注意 的 是 ， 在 此 并 没有 采用 其 他 的 合作 方法 。 模 式 发 生 器 的 初始 状 
态 由 约束 问题 的 初始 解决 定 。 然 而 运动 的 结果 并 不 理想 ， 由 图 可 知 ， 存 在 一 些 噪 
声 ， 且 在 螺旋 形 模式 中 ， 机 器 人 还 可 能 在 编队 中 偶尔 交换 位 置 。 

尽管 这 些 结果 并 不 理想 ， 但 仍 可 表明 利用 ALICA 中 的 约束 优化 问题 以 及 产 
生 搜 索 模 式 的 一 个 反馈 系统 可 形成 并 协调 根据 给 定 模式 下 的 搜索 路 线 。 该 方法 仅 
作为 概念 验证 ， 还 需要 进一步 研究 。 虽 然 这些 分 析 已 超出 本 书 范畴 ， 但 该 方法 的 
优点 还 是 显而易见 的 : 

o 直接 与 其 他 编程 语言 的 元 素 集成 ， 从 而 可 在 状态 转移 的 不 同行 为 之 间或 动 
态 重 分 配 的 任务 交换 之 间 来 回 切换 。 

© 在 机 器 人 损坏 时 可 人 允许 自动 增强 ， 此 时 搜索 路 线 自动 缩小 ， 从 而 在 搜索 区 
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图 10.23 ”执行 搜索 模式 的 机 器 人 
a) 矩形 模式 b) 螺旋 形 模式 


o 最 后 ， 该 方法 具有 可 进行 分 析 的 清晰 的 数学 基础 。 
10.4.3 BANE 

本 节 利 用 ALICA 对 搜索 未 知 区 域 中 特定 物体 并 将 这 些 物 体 运 回 基地 的 团队 
机 器 人 行为 进行 了 建 模 ， 阐 述 了 如 何 组 合 ALICA 中 的 不 同 建 模 元 素 以 形成 对 团 
队 行 为 的 一 个 简洁 且 和 鲁 棒 的 描述 。 该 建 模 方法 已 应 用 于 DLR 协调 项 目 IMPERA, 

最 后 ， 简 要 描述 了 如 何 对 基于 约束 优化 的 行为 描述 进行 扩展 来 描述 一 个 机 器 
人 动态 系统 。 对 于 后 者 的 结果 非常 具有 前 景 ， 将 这 些 描述 与 理论 相 结合 ， 也 是 今 
后 进一步 研究 的 内 容 。 


10.5 搜救 仿真 


在 最 后 一 个 评估 场景 中 ， 考 虑 搜救 领域 。 后 面 将 介绍 的 实验 的 目的 如 下 : 

o 证 明 ALICA 可 用 于 其 他 约束 问题 领域 。 

© 评估 在 其 他 技术 方面 的 竞争 力 。 

© 评估 在 团队 智能 体 个 数 方面 ALICA 的 可 扩展 性 。 

接 下 来 ， 采 用 Kleiner 等 人 "提出 的 一 个 RoboCup 搜救 仿真 项 目 2 的 开源 仿 
真 器 RMASBENCH。 实 验 中 ,模拟 发 生 一 次 灾难 性 事件 。 城 市 中 多 处 着 火 ， 并 在 
建筑 物 中 迅速 蔓延 ， 威 胁 着 整个 城市 。 该 场景 中 的 智能 体 作 为 能 够 到 处 运动 并 灭 
火 的 消防 队员 。 仿 真 截图 如 图 10. 24 pra. 


© http: //www. robocuprescue. orgo 
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智能 体 所 面临 的 主要 问题 之 一 是 要 确定 哪个 智能 体 负责 扑灭 哪 处 火灾 。 由 于 
火势 蔓延 以 及 被 扑灭 都 是 一 个 动态 域 ， 因 此 智能 体 应 不 断 地 更 新 决策 。RMAS- 
BENCH 针对 该 问题 可 提供 某 些 集成 技术 : 

o 示范 智能 体 : 该 策略 作为 一 个 基准 。 每 个 智能 体 根据 效用 函数 选择 一 个 附 
近 的 目标 。 由 于 每 个 智能 体 都 根据 自身 来 进行 决策 ， 因 此 可 看 作 一 个 简单 的 分 布 
式 方法 。 

© 匈牙利 指派 算法 ”是 一 种 将 n 个 智能 体 最 优 分 配给 m 个 任务 的 集中 式 算 
法 。 最 多 为 每 个 任务 指派 一 个 智能 体 ， 这 将 会 造成 在 很 多 情况 下 没有 最 优 解 。 

© DSA (分 布 式 随机 算法 ) S 是 一 种 用 于 分 布 式 约束 优化 的 分 散 式 方法 。 
在 给 定 关 于 其 他 智能 体 的 当前 信念 条 件 下 ， 每 个 智能 体 可 计算 最 佳 分 配 。 并 以 某 
一 固定 概率 〈 本 实验 中 取 0.5) 应 用 。 如 果 一 个 智能 体 改变 其 分 配 ， 则 需 将 结果 
向 整个 团队 广播 。 


10.24 RMASBENCH 截图 (各 个 点 表示 消防 队 ， 不 同 级 别 的 火势 分 别 由 
和 用 的 建筑 来 表示 。 已 扑灭 的 建筑 为 “和 时 。 黑 框 表示 已 烧毁 ) 


除了 解决 分 配 问 题 的 算法 外 ， 问 题 表 征 对 整个 团队 的 性 能 也 有 很 大 影响 。 
RMASBENCH 中 采用 的 默认 问题 表征 方式 是 将 某 一 效用 值 与 每 个 智能 体 一 着 火 点 
对 相关 联 : 


第 10 章 评 tr 165 


0 如 果 分 配给 / 的 智能 体 个 数 超过 一个 建筑 的 特定 值 4(/) 
Top 如 果 火 势 还 处 于 早期 阶 和 

MOD) 10k EME 
ep 


式 中 dla, f) 一 一 智能 体 a 和 着 火 点 /之 间 的 距离 。 

该 效用 值 对 火灾 的 早期 阶段 具有 重要 作用 ， 易 于 扑灭 ， 而 且 通 常 发 生 在 较 大 
火灾 的 外 围 。 对 其 中 每 个 智能 体 为 一 行 ， 每 个 火灾 点 为 一 列 的 结果 矩阵 进行 归 一 
化 ， 并 作为 上 述 分 配 算法 的 输入 。 

为 了 将 这 些 方法 和 ALICA 进行 比较 ,需要 将 该 效用 函数 转换 为 一 个 适合 
于 ALICA 概念 的 值 。 然 而 ALICA 中 的 任务 都 是 静态 的 ， 即 一 个 给 定 规划 中 具 
有 固定 的 任务 集合 ， 而 着 火 点 的 个 数 则 是 随时 间 动 态 变化 的 。 如 果 没 有 一 个 其 
他 的 生成 算法 ,那么 该 问题 就 无 法 表示 为 一 个 ALICA 的 任务 分 配 。 实 际 上 ， 
该 约束 问题 可 利用 约束 条 件 和 目标 函数 进行 表示 。 目 前 所 考虑 的 约束 问题 类 都 
是 采用 连续 值 ， 而 此 处 的 约束 问题 是 离散 的 ， 因 此 需要 将 给 定 的 离散 问题 转换 
为 一 个 连续 的 约束 优化 问题 。 基 本 思想 是 对 智能 体 的 目标 位 置 进行 优化 。 如 果 
目标 位 置 与 着 火 点 之 间 的 距离 小 于 某 一 阔 值 ， 则 就 考虑 分 配 相应 的 智能 体 去 灭 
火 。 对 于 该 问题 ， 类 似 于 10. 4 节 中 的 实验 ， 再 次 采用 智能 体 功 能 流 来 确定 智 
能 体 的 目标 位 置 。 

设 丰 为 一 个 着 火 点 集合 ， 忆 (oa,， 亡 表示 原始 效用 函数 U(a，f) 在 智能 体 不 
多 的 情况 : 

10° 


Kef 如 果 了 仍 处 于 早期 阶段 
Ulaf = 如 果 了 燃烧 得 很 厉害 
10’ 
laf 其 他 


由 此 可 建立 一 个 连续 的 目标 函数 o(P，r) : 
o(p,T) = > > (d,(a,f) <e? U,(a,f):0) 


a‘In(a,p,7,z) fe F 


式 中 d,(a, f) 一 一 相对 于 智能 体 a 和 着 火 点 了 之 间 的 实际 距离 ; 
d(a, f) a 的 约束 目标 位 置 与 了 之 间 的 距离 ; 
? 三 元 运算 符 ， 用 于 具体 化 约束 条 件 : 
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a T( od) >0 
(gra: b) | 
b 其 他 
-(a-b) 276) TH) >0 
È (ra: b) def a 
和 (a-b) 214) 其 他 


约束 条 件 的 具体 化 是 一 种 避免 约束 条 件 产 生 组 合 爆炸 的 常用 约束 规划 方法 。 
在 此 ， 定 义 一 个 特殊 的 梯度 ， 以 使 得 求解 器 中 不 会 出 现 一 个 平面 场景 。 
对 每 个 着 火 点 只 能 分 配 有 限 个 智能 体 的 要 求 可 用 约束 少 表示 : 
oy Lalas) < el 0)) =") 


a;In(a,p, 


在 此 ， 并 不 限制 将 所 有 的 智能 体 分 配给 个 着 火 点 ， 否 则 可 能 会 导致 着 火 点 
较 少时 的 一 个 约束 不 满足 问题 。 根 据 约束 和 目标 函数 o(p，7) ， 可 在 连续 空间 
下 近似 一 个 原始 分 配 问题 。 每 个 智能 体 的 目标 位 置 都 是 笛 卡 尔 空 间 下 的 一 个 二 维 
矢量 。 通 过 城市 规模 大 小 可 推导 这 些 位 置 的 合理 边界 。 

这 时 一 个 ALICA 行为 就 可 查询 其 目标 位 置 ， 并 对 仿真 器 发 布 朝 最 接近 该 位 
置 的 着 火 点 运动 并 灭火 的 命令 。 

ALICA 的 规划 相当 简单 。 所 有 智能 体 执行 同样 的 任务 并 处 于 同样 的 状态 
出 于 评估 的 目的 ， 将 该 策略 称 为 ClobalCOP。 针 对 该 策略 的 COP 核心 么 \ 式 的 规模 
与 着 火 点 个 数 以 及 智能 体 个 数 成 线性 关系 。 男 外 ， 搜 索 空 间 的 大 小 会 随 着 智能 体 
个 数 的 增加 而 指数 增 大 。 因 此 认为 若 智能 体 超过 某 一 特定 数量 ， 则 该 策略 不 可 
行 。 但 由 于 ALICA 具有 很 强 的 约束 问题 分 解 作用 ， 因 此 利用 该 特点 来 评估 称 为 
RegionCOP 的 第 二 种 策略 。 该 策略 根据 分 别 占 地 图 的 1/4 的 四 个 任务 来 划分 团 
队 。 在 每 个 任务 中 ， 智 能 体 根据 上 述 类 似 方法 来 求解 COP， 但 需要 在 1/4 地 图 中 
限制 执行 任务 的 智能 体 以 及 着 火 点 。 为 实现 任务 分 配 ， 采 用 如 下 的 效用 加 数 : 


f(B) = $ P(o, 9 + TAT a: - d(a,c,)?/maxDist ) ) 


I » Px Tir 2) I 
式 中 已 =min (1, 1-F; + 2) ly, 


È enh) 
EO) 
9 若 f 仍 在 早期 阶段 
w(f) =141 若 f 燃 烧 剧 烈 
4 其 他 ; 
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M 一 一 第 i 象限 中 的 着 火 点 集合 ; 
d(p, q) 一 一 常用 距离 函数 ; 
第 i 象限 的 中 心 点 ; 
Ti 一 一 与 第 ;象限 相关 的 任务 。 i 
直观 上 , AB) 是 测量 四 个 象限 中 着 火 点 的 加 权 分 布 ， 并 对 智能 体 也 采用 类 似 
的 分 布 。 另 外 ， 智 能 体 首先 选 择 接近 的 象限 区 域 。 由 于 搜索 空间 较 大 (如 四 个 象 
限 中 有 50 个 智能 体 ) ， 则 如 果 人 允许 空闲 5” ， 就 会 有 4” 种 可 能 ， 且 启发 式 算法 必须 
非常 精确 。 在 此 采用 一 种 基于 贪心 分 配 的 简单 算法 来 计算 f(B) 的 启发 式 。 

策略 RegionCOP 是 采用 一 种 扁平 的 任务 层次 结构 来 简化 约束 优化 问题 ， 同 时 
要 求 智 能 体能 够 立即 工作 于 多 个 着 火 点 。 在 接 下 来 的 实验 中 ， 将 采用 该 策略 来 验 
证 ALICA 中 任务 分 配 的 可 扩展 性 。 

所 有 实验 都 采用 同一 场景 : 在 如 图 10. 24 所 示 的 城市 中 有 三 处 着 火 的 不 同位 
置 。 在 每 个 实验 中 ， 改 变 智 能 体 个 数 以 及 智能 体 开 始 工作 的 时 间 。 智 能 体 工作 得 
越 晚 ， 则 灭火 难度 越 大 ， 这 是 因为 火 情 已 经 开始 草 延 。 因 此 在 此 将 起 始 时 间 设 为 
max(100, 2n+1), EP n 为 智能 体 的 个 数 。 由 此 可 看 出 ， 团 队 规模 越 大 则 面临 
问题 的 难度 也 越 大 。 起 始 时 间 的 上 限 设 为 100， 以 使 得 在 智能 体 开 始 行动 之 前 ， 
城市 仍 保持 原样 。 另 外 ， 这 个 固定 的 起 始 时 间 还 可 对 其 他 智能 体 如 何 采用 不 同 策 
略 来 解决 同一 约束 问题 进行 评估 。 

在 仿真 过 程 的 每 个 时 间 节 拍 (tick) 中 ， 每 个 智能 体 的 一 个 审议 周期 内 包括 
如 下 步骤 : 

o 将 来 自 仿 真 器 的 信息 集成 到 环境 模型 中 ， 这 些 信息 包括 城市 中 智能 体 的 
位 置 和 所 有 着 火 点 的 状态 。 

@ 将 智能 体内 部 状态 的 信息 及 其 位 置 发 送 给 团队 。 

e 一 旦 执行 一 个 ALICA 规则 的 应 用 步 又， 则 所 有 应 用 规则 都 执行 。 

© 行为 不 断 查 询 约束 的 目标 位 置 ， 并 对 仿真 器 发 布 相 应 命令 。 

在 每 个 时 间 节 拍 中 约束 求解 器 所 需 的 时 间 设 为 600ms。 注 意 到 这 是 一 个 软 约 
东 ， 求 解 器 总 是 从 优先 选择 的 聚 类 中 心 开 始 运行 至 少 一 次 ， 以 及 从 随机 点 开始 至 
少 一 次 搜索 运行 。 本 实验 是 在 Intel 8 Core™ i7 CPU (2.8GHz) 的 Linux3. 0. 0 平 
台 上 运行 的 。 

图 10. 25 给 出 了 仿真 结束 时 过 火 后 建筑 的 实验 结果 ， 即 所 有 火灾 扑灭 后 ， 或 
300 个 时 间 节 拍 之 后 。 图 中 每 个 点 都 是 表示 十 次 实验 的 平均 值 。 值 得 注意 的 是 ， 
在 智能 体 个 数 小 于 40 时，GlobalCOP 与 DSA 算法 的 性 能 等 效 ， 而 若 智能 体 个 数 
大 于 40， 则 GlobalCOP 执行 的 效果 要 比 DSA 算法 的 效果 差 。 在 这 个 场景 中 ， 改 
进 RegioinCOP 策略 的 性 能 最 佳 ， 尽 管 在 智能 体 个 数 较 多 时 可 能 与 DSA 的 性 能 差 
别 不 大 ， 而 其 他 分 配 策略 的 性 能 要 差 得 多 。 


Ci 
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图 10.25 灭火 性 能 : 着 火 建筑 与 智能 体 个 数 


男 外 还 可 看 出 ， 由 于 智能 体 开始 工作 有 延迟 ， 那 么 在 智能 体 个 数 最 多 50 个 
时 ， 所 有 策略 中 过 火 的 建筑 都 会 增加 。 然 而 对 于 起 始 时 间 固 定 ， 具 有 50 个 智能 
体 且 其 他 条 件 同 上 的 实验 ， 不 管 采用 什么 算法 ， 增 加 智能 体 个 数 只 能 稍微 提高 
性 能 。 

由 此 可 得 出 结论 ， 具 有 ALICA 求解 器 的 连续 原始 约束 分 配 问题 能 够 获得 相 
当 好 的 性 能 。 但 值得 注意 的 是 ，DSA 方法 要 比 ALICA 中 连续 求解 器 的 计算 成 本 
低 。 这 是 由 于 ALICA 智能 体 总 是 考虑 整个 约束 问题 ， 而 DSA 控制 的 智能 体 只 考 
虑 对 局 部 智能 体 的 选择 。 另 外 ， 由 于 要 映射 到 连续 问题 ，ALICA 求解 器 的 搜索 
空间 会 非常 大 。 本 书 所 提 方 法 主要 针对 这 种 连续 域 ， 这 样 的 话 ， 如 果 连 续 值 是 必 
不 可 少 的， 那么 对 于 该 约束 问题 会 更 具 可 行 性 。 

COP 求解 器 的 可 扩展 性 可 由 图 10. 26 进行 评估 。 图 中 给 出 了 每 个 智能 体 在 每 
个 时 间 节 拍 内 对 于 对 数 标 尺 上 60 ~ 80 个 着 火 点 的 环境 状态 所 进行 的 平均 功能 评 
估 。 评 估 数 会 随 着 智能 体 个 数 的 增加 而 急剧 下 降 。 这 是 由 于 公式 规模 的 增 大 ， 问 
题 维度 的 增 大 和 共享 计算 功能 的 仿真 智能 体 个 数 的 增加 。 当 智能 体 个 数 较 多 时 ， 
求解 器 就 无 法 满足 600ms 求解 时 间 的 软 约 束 ， 从 而 使 得 功能 评估 数 减 少 。 图 中 
还 表明 ， 通 过 RegionCOP 对 约束 问题 进行 分 解 可 允许 在 每 个 时 间 节 拍 内 执行 的 功 
能 评估 会 增加 一 个 数量 级 ， 从 而 使 得 智能 体 可 以 更 加 彻底 地 在 较 小 的 搜索 空间 中 
进行 搜索 。 值 得 注意 的 是 ， 图 10. 26 中 的 功能 评估 数 仅 反映 了 规定 时 间 内 的 计算 
次 数 ， 而 不 是 分 配 完 成 后 的 计算 次 数 。 该 求解 器 花费 所 有 时 间 来 试图 寻找 一 个 更 


优 解 ， 而 不 管 该 解 是 否 存在 。 
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智能 体 个 数 
对 60 ~80 个 着 火 点 的 功能 评估 


10. 26 


当然 ， 提 高 RegionCOP 的 求解 速度 并 不 是 没有 代价 。 该 策略 需要 将 所 有 智能 
体 分 配给 四 个 任务 。 图 10.27 给 出 了 如 何 对 该 算法 进行 扩展 ， 图 中 给 出 了 利用 
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智能 体 个 数 
图 10.27 ”任务 分 配 扩 展 步 又 
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A 搜索 算法 执行 扩展 步骤 的 个 数 。 尽 管 在 平均 情况 下 步骤 增多 与 智能 体 个 数 成 
正比 ， 但 最 差 情 况 下 步骤 个 数 是 参与 智能 体 个 数 的 指数 关系 。 这 并 不 奇怪 ， 因 为 
毕竟 该 问题 是 一 个 难 解 问题 。 然 而 为 分 配 100 个 智能 体 ， 平 均 扩 展 大 约 200 次 步 
又 ， 则 算法 扩展 性 相当 好 。 该 性 能 很 大 程度 上 取决 于 所 采用 的 特定 启发 式 方法 。 

值得 注意 的 是 ， 测 试 方法 的 性 能 会 随 着 应 用 场景 的 变化 而 不 同 。 例 如 ， 图 
10. 28 给 出 了 在 不 同 场景 下 进行 实验 时 不 同 算法 的 性 能 。 实 验 数据 是 进行 十 次 实 
验 之 后 的 平均 值 。RegionCOP 一 直 保 持 具有 较 好 的 结果 ， 而 GlobalCOP 试图 将 火 
势 处 于 可 控 之 下 ， 可 在 十 次 实验 中 四 次 有 效 遏 制 火 势 。 其 他 所 有 策略 都 无 法 在 实 
验 结束 时 ( 即 经 过 300 个 时 间 节 拍 ) 扑灭 所 有 的 火灾 。 值 得 注意 的 是 ， 在 这 个 
特定 的 实验 中 ， 简 单 的 示范 智能 体 策略 要 比 DSA 策略 在 表示 对 场景 的 影响 方面 
结果 更 好 。 
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10.28 18 个 智能 体 灭火 性 能 示例 


总 之 ， 在 此 对 搜救 领域 进行 了 评估 ， 利 用 ALICA 最 多 可 使 100 个 智能 体 协 
调 工作 。 通 过 将 一 个 离散 的 约束 优化 问题 转换 到 连续 域 ， 表 明 所 得 的 约束 问题 可 
利用 本 书 所 提 方 法 进行 求解 。 而 且 相 应 的 策略 在 性 能 上 可 与 分 布 式 随机 算法 处 理 
最 多 40 个 智能 体 的 原始 约束 问题 相 媲 美 ， 而 同样 条 件 下 ALICA 的 性 能 相对 较 
差 。 最 后 ， 还 表明 利用 ALICA 语言 元 素 〈 如 任务 和 效用 函数 ) 可 实现 一 个 相当 
简单 的 约束 问题 分 解 ， 并 证 明 策 略 要 优 于 原始 策略 。 


第 11 章 总 结 


本 书 提出 了 一 种 对 自主 机 器 人 团队 行为 建 模 的 全 面 解决 方法 。 该 方法 主要 是 
面 对 动 态 环境 域 ， 在 该 领域 下 ， 机 器 人 在 协调 一 致 行动 时 必须 具有 高 度 的 反应 
能 力 。 

本 书 的 主要 贡献 在 于 提出 了 一 种 从 全 局 感知 角度 描述 团队 行为 的 编程 语言 。 
该 语言 的 语义 定义 了 一 个 执行 屋 ， 并 进行 了 详细 阐述 。 从 实体 机 器 人 或 智能 体 中 
通过 能 力 将 其 映射 到 相应 角色 来 进行 抽象 ， 然 后 又 利用 角色 将 机 器 人 动态 地 分 配 
到 规划 中 的 任务 中 ， 这 些 规划 是 编程 语言 的 核心 。 通 过 层次 化 的 有 限 状 态 机 来 描 
述 处 理 问题 的 策略 或 方法 。 执 行 层 具有 一 个 有 效 的 递归 任务 分 配 算法 ， 每 个 智能 
体 根据 该 算法 来 局 部 计算 相关 的 任务 分 配 。 通 过 暂时 及 局 部 地 将 决策 协议 自 适应 
切换 到 一 个 集中 式 分 配 算法 来 可 靠 地 检测 和 消解 冲突 。 丧 失 行 为 能 力 的 机 器 人 可 
完全 由 团队 进行 补偿 。 

在 本 书 的 第 3 部 分 ， 通 过 采用 连续 域 非 线性 约束 满足 和 优化 问题 来 表示 团队 
的 复杂 意图 ， 由 此 实现 对 该 编程 语言 的 扩展 。 在 运行 过 程 中 ， 参 与 机 器 人 随时 合 
作 利 用 求解 器 对 上 述 约束 问题 进行 求解 。 这 些 求解 器 之 间 的 合作 重点 在 于 提高 单 
个 机 器 人 的 反应 能 力 ， 并 在 感知 噪声 情况 下 实现 团队 机 器 人 的 协调 一 致 性 。 

所 得 的 框架 是 完全 分 布 式 的 ， 并 由 有 限 状 态 机 、 基 于 效用 的 决策 和 约束 规划 
的 全 新 组 合 构成 。 这 种 组 合 可 产生 一 种 针对 系统 设计 师 的 功能 强大 的 建 模 语 言 以 
及 规划 器 等 产生 式 算法 。 

在 理论 方面 ， 得 到 了 为 实现 无 冲突 分 配 ， 产 生 规划 必须 满足 的 可 证 明 条 件 的 
层次 化 任务 分 配 结果 。 在 此 给 出 满足 不 同 需求 的 两 种 任务 分 配 算法 : 一 种 算法 是 
允许 智能 体 被 动 参与 到 一 个 规划 ; 另 一 种 算法 是 要 求 所 有 智能 体 在 任何 时 候 都 主 
动 执 行 某 一 任务 。 

参考 实现 是 一 种 开源 且 成 功 应 用 于 RoboCup 队伍 Carpe Noctem 的 程序 。 另 
外 ， 还 应 用 于 DLR 合作 项 目 IMPERA。 

第 10 章 中 的 评估 表明 ALICA 可 在 不 同 领域 (如 机 器 人 足球 、 搜 救 和 外 太空 
探索 ) 成 功 地 控制 与 协调 机 器 人 。 另 外 ， 实 验 还 展示 了 对 感知 噪声 和 非 可 靠 性 
通信 的 鲁 棒 性 。 最 后 ， 搜 救 领域 的 实验 结果 表明 该 集成 算法 的 性 能 可 与 目前 先进 
的 任务 分 配方 法 相 媲美 ， 利 用 ALICA 可 控制 和 协调 大 型 机 器 人 团队 。 

通过 ALICA 程序 的 层次 化 结构 以 及 局 部 性 原理 ， 智 能 体 求解 器 之 间 的 合作 
和 实现 任务 分 配 算法 的 启发 式 功能 ， 可 实现 对 ALICA 的 扩展 。 然 而 对 于 过 于 庞 
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大 的 智能 体 集合 ， 可 能 需要 其 他 方法 〈 如 社会 法 制 或 规范 ) 来 进行 精确 建 模 。 
对 于 一 种 有 组 织 的 集成 范式 ， 所 提出 的 基于 约束 的 建 模 方 法 是 一 个 非常 有 前 途 的 
基础 。 


11.1 需求 分 析 


在 1.2 节 中 ,介绍 了 一 组 要 求 所 提 方 法 能 够 处 理 的 具有 挑战 性 的 领域 。 在 
此 ， 简 单 总 结 一 下 如 何 解 决 这 些 问题 。 

连续 变化 的 环境 ALICA 中 的 每 个 智能 体 都 根据 自身 的 局 部 决策 进行 动作 ， 
无 需 任何 事先 通信 ， 由 此 可 对 所 有 未 知 变化 直接 反应 。 动 态 重 分 配 可 允许 智能 体 
切换 任务 或 整个 规划 来 适应 这 种 动态 变化 。 另 外 ， 约 束 求 解 器 也 总 是 针对 当前 状 
态 来 求解 一 个 按 需 构建 的 约束 问题 ， 因 此 也 重点 关注 于 反应 能 力 。 在 实现 方面 ， 
是 利用 规则 应 用 部 件 来 完成 的 ， 即 在 程序 层次 结构 中 可 随时 进行 更 新 而 不 存在 任 
何 由 于 线程 同步 所 造成 的 延迟 。 

具有 噪声 的 感知 器 ”尽管 ALICA 中 没有 一 个 感知 融合 部 件 ， 并 且 还 应 与 相 
应 的 部 件 配合 使 用 ， 但 在 具有 一 定 程 度 的 反应 能 力 时 能 够 具有 抗 品 功 能 。 首 先 ， 
在 具有 噪声 的 情况 下 可 通过 阔 值 或 类 似 的 值 来 使 得 任务 分 配 保持 稳定 。 其 次 ， 如 
10.3 节 所 述 ， 团 队 能 够 在 不 牺牲 单个 智能 体 反应 能 力 的 情况 下 得 到 约束 问题 的 
稳定 解 。 

部 分 可 观测 的 环境 ”作为 一 个 执行 和 协调 层 ，ALICA 并 不 直接 处 理 该 问题 。 
该 问题 的 一 种 解决 方法 是 部 分 表示 该 环境 ， 即 ALICA 并 不 参与 以 保持 域 的 独立 
性 。 然 而 由 于 ALICA 智能 体 不 断交 换 各 自行 为 信息 ， 整 体 行为 很 少 依赖 于 个 体 
信念 。 这 在 ALICA 所 遵循 的 局 部 性 原理 中 有 着 明显 的 体现 ， 使 得 智能 体 并 不 考 
虑 自身 没有 主动 或 被 动 参与 的 问题 或 规划 。 因 此 ， 局 部 信息 已 足以 使 得 一 个 智能 
体 完 成 其 在 团队 中 的 任务 。 

非 可 靠 性 通信 网络 质量 较 差 情况 下 的 鲁 棒 性 已 在 10. 2 节 中 进行 了 详细 评 
估 。 结 果 表 明 ， 在 高 丢 包 率 或 延迟 情况 下 仍 具 有 高 度 的 协调 一 致 性 。 

团队 成 员 损坏 ”丧失 行为 能 力 的 机 器 人 可 直接 通过 动态 重 分 配 来 补偿 。 由 于 
缺少 能 力 或 机 器 人 ， 不 再 执行 当前 规划 ， 若 存在 另 一 个 规划 ， 就 选择 执行 该 规 
划 。 和 否则 就 会 产生 故障 ， 并 通过 程序 的 层次 化 进行 传播 ， 直 到 该 问题 解决 。 


11.2 展望 与 未 来 


本 书 工作 主要 是 对 自主 移动 机 器 人 团队 行为 的 建 模 和 协调 提出 一 种 全 面 的 解 
决 方案 ， 但 仍 存在 一 些 问 题 尚 待 解决 。 另 外 ，ALICA 还 可 进行 扩展 以 更 便于 集 
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成 更 多 的 部 件 。 接 下 来 ， 对 一 些 最 重要 的 问题 以 及 可 能 进行 的 扩展 进行 总 结 。 

规划 集成 ”在 传统 意义 上 ALICA 没有 一 个 规划 部 件 ， 然 而 编程 语言 的 设计 
主要 是 依靠 一 种 规划 的 思想 ， 因 此 可 对 合适 的 语言 元 素 (如 终止 状态 和 行为 ) 
定义 后 置 条 件 。 在 运行 过 程 中 并 没有 利用 这 些 后 置 条 件 ， 但 在 规划 期 间 具 有 重要 
作用 。 在 研究 项 目 IMPERA 中 正在 对 规划 集成 进行 研究 。 

基于 SMT 的 约束 求解 和 优化 ”第 8 章 在 ALICA 中 采用 了 SMT 求解 器 ， 并 大 
致 描述 了 扩展 该 求解 器 具有 跟踪 和 协调 能 力 的 可 能 方法 。 据 现 有 知识 ， 目 前 还 不 
存在 满足 本 书 讨论 的 SMT 求解 器 ， 然 而 9. 3 节 中 的 实验 表明 基于 SMT 的 技术 可 
在 性 能 上 得 到 极 大 提高 。 

任务 分 配 与 约束 求解 的 融合 如 9.7 节 所 述 ，ALICA 智能 体 在 运行 时 具有 两 
种 可 能 存在 的 计算 成 本 过 高 的 问题 。 首 先是 任务 (E) 分 配 ， 其 次 是 约束 求解 。 
如 果 能 针对 约束 问题 进行 任务 分 配 ， 将 两 者 集成 或 许 能 产生 对 行为 更 精确 的 描述 
以 及 更 佳 的 团队 性 能 。 目 前 只 有 一 种 可 能 方法 ， 即 采用 来 自 于 条 件 或 效用 函数 中 
的 当前 解 。 如 何 解决 所 产生 的 复杂 性 问题 仍 是 一 个 难题 。 

利用 微分 约束 问题 进行 动态 行为 建 模 ”利用 约束 问题 来 设 定 行为 的 方法 ， 可 
很 容易 地 通过 一 个 反馈 扩展 到 本 质 上 是 一 种 随时 间 变 化 的 微分 方程 的 约束 问题 。 
在 10.4 节 中 ， 讨 论 了 利用 该 方法 如 何在 没有 一 个 中 心 部 件 或 指定 初始 状态 的 条 
件 下 进行 动态 编队 表示 。 但 仍 缺 乏 一 种 理论 来 保证 如 何 控制 系统 的 不 同 特性 
(如 机 器 人 速度 和 一 致 性 程度 ) 。 针 对 该 系统 及 其 相关 的 其 他 方法 (如 Jaeger 和 
Christaller' 提出 的 Dual Dynamics 设计 机 制 ) 是 今后 的 重点 研究 问题 。 

CSP 的 冲突 消解 ”本 书 提出 的 针对 约束 问题 的 一 致 性 解决 方法 目前 尚 不 能 扩 
展 到 单个 约束 问题 ， 即 每 个 机 器 人 都 认为 显著 不 同 ， 但 通过 某 些 变量 相互 关联 。 
处 理 该 问题 需要 根据 Petcu” 所 提出 的 DCOP 求解 器 来 提供 其 他 信息 。 由 非 线性 
约束 、 连 续 域 、 动 态 环境 和 非 可 靠 性 通信 组 合 所 产生 的 其 他 问题 仍 没 有 解决 。 
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